分割GBK中文遭遇乱码的解决方法
类似如下的字符串(GBK), explode不能得到正确结果:
1.$result = explode("|", "滕华弢|海青"); 究其原因, 对于”弢”字(读tao,不认识没关系,我也不认识), 因为他的GBK编码值为: 8f7c, 不巧的是, “|”的ASCII值也是7c.
这样的问题, 还有很多 : 因为GBK编码的编码范围是: 0×8140-0xfefe, 所以, 理论上来说, 任何低字节是7c的字都会有这个问题, 比如:
1.倈(827c), 億(837c), 眧(b17c), 鍇(e57c).......等等等等对于这样的情况,
1.第一, 可以采用转码到utf8, 然后explode, 再转回来, 这是比较麻烦的方法.
2.第二, 我们可以采用正则拿"匹配出"来代替"分离出":
3.preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//写死编码这样, $matches中0号索引对应的数组就是结果词的数组了..
相关推荐
-
分割GBK中文遭遇乱码的解决方法
类似如下的字符串(GBK), explode不能得到正确结果: 1.$result = explode("|", "滕华弢|海青"); 究其原因, 对于"弢"字(读tao,不认识没关系,我也不认识), 因为他的GBK编码值为: 8f7c, 不巧的是, "|"的ASCII值也是7c. 这样的问题, 还有很多 : 因为GBK编码的编码范围是: 0×8140-0xfefe, 所以, 理论上来说, 任何低字节是7c的字都会有这个问题,
-
Linux下JDK中文字体乱码的解决方法
问题描述: 部署在linux下的java应用程序中的中文会变成一个一个的"口"字,也就是乱码 问题分析: 代码中使用了如下的实现方式: new java.awt.Font("宋体", Font.PLAIN, 12)那么jdk中一定需要"宋体"这个字体($JAVA_HOME/jre/lib/fonts目录下) 由于JDK默认没有中文字体,所以就会显示为乱码 需要手工设置一下,让java应用程序能够找到所需的中文字体 解决方式: 将需要的字体文件上传
-
js传值后台中文出现乱码的解决方法
本文实例讲述了js传值后台中文出现乱码的解决方法.分享给大家供大家参考,具体如下: 在"test.jsp"页面中,需要通过js将值传递到后台,后台根据传递的值进行数据查询时,通过test.jsp的js进行编码(标注部分的代码),后台Java解码(注释标注部分为解码),可以解决 test.jsp: <script type="text/JavaScript" charset="UTF-8"> function test() { //下面
-
JS传值出现中文参数乱码的解决方法
本文实例讲述了JS传值出现中文参数乱码的解决方法.分享给大家供大家参考,具体如下: function PopupFK(cNum,type){ var url = "contract!Paying.action"; url = url + "?contract.contractNum="+cNum+"&payingType="+type; // if(isEmpty($(_this).attr("payId"))){ /
-
PHP附件下载中文名称乱码的解决方法
本文实例讲述了PHP附件下载中文名称乱码的解决方法.分享给大家供大家参考,具体如下: PHP中,如果要下载的文件名称为中文,则会出现文件标题乱码. 此时就需要对标题进行编码,也就是说先进性urlencode,然后再放入header,然后问题就解决了. $filename = urlencode("下载文档"); header ( "Content-disposition: attachment; filename=$filename.xls" ); 网上说,在RFC
-
Django生成PDF文档显示网页上以及PDF中文显示乱码的解决方法
项目地址:https://github.com/PythonerKK/django-generate-pdf/tree/master 这个demo实现了通过用户输入自己的个人信息生成一份简历pdf,来阐述如何使用Django的HttpResponse生成PDF的文档. 先上效果图: 安装依赖库 首先安装Django最新版2.2.2和PDF依赖包xhtml2pdf pip install django pip install xhtml2pdf 编写表单验证 为了简单起见,这个demo依赖数据库,
-
php上传文件中文文件名乱码的解决方法
可能会有不少朋友碰到一些问题就是上传文件时如果是英文倒好原文名不会有问题,如果是中文可能就会出现乱码了,今天我来给大家总结一下导致乱码php上传文件中文文件名乱码的原因与解决办法吧. 这几天在windows下安装了XAMPP,准备初步学习一下php的相关内容.这几天接触到了php上传文件,但是出现了一个郁闷问题,我准备上传一个excel文件,但是如果文件名是中文名就会报错. 一来二去很是郁闷,后来仔细想了想应该是文件编码的问题,我写的php文件使用的是UTF-8编码,如果没有猜错APACHE处理
-
JQuery的Ajax中Post方法传递中文出现乱码的解决方法
本文实例讲述了JQuery中Post传递中文出现的解决方法,即乱码ajax与jquery.ajax中文参数post传递乱码处理方法.分享给大家供大家参考.具体分析如下: 问题一: 今天在做项目时,需要用到Ajax,之前我在用GET方式传递中文参数时,只需要在后台程序中设置页面编码为GB2312即中文能正常显示,可是这次由于表单项目较多,不适合用GET方式传递,只能用POST方式,但发现后台程序中设置编码为GB2312时中文还是显示的乱码.经过一番研究问题才最终得到解决. 解决方法: 解决此问题的
-
python操作mysql中文显示乱码的解决方法
本文实例展示了一个脚本python用来转化表配置数据xml并生成相应的解析代码. 但是在中文编码上出现了乱码,现将解决方法分享出来供大家参考. 具体方法如下: 1. Python文件设置编码 utf-8 (文件前面加上 #encoding=utf-8) 2. MySQL数据库charset=utf-8 3. Python连接MySQL是加上参数 charset=utf8 4. 设置Python的默认编码为 utf-8 (sys.setdefaultencoding(utf-8) 示例代码如下:
-
DW中链接mysql数据库时,建立字符集中文出现乱码的解决方法
只是中文出现乱码时,在链接数据库后面,加上这一句 utf8的话 mysql_query("SET NAMES 'utf8'"); gbk的话 mysql_query("SET NAMES 'gbk'");
随机推荐
- 匹配yyyy-mm-dd日期格式的的正则表达式
- Shell脚本中单引号(‘)和双引号(“)的使用区别
- mssql2005字符串连接方法 避免无效的连接错误
- jQuery监控文本框事件并作相应处理的方法
- java 中HashMap、HashSet、TreeMap、TreeSet判断元素相同的几种方法比较
- JavaScript实现点击单选按钮改变输入框中文本域内容的方法
- 实例讲解.NET中资源文件的创建与使用
- javascript两种function的定义介绍及区别说明
- php计算几分钟前、几小时前、几天前的几个函数、类分享
- JavaScript简单实现网页回到顶部功能
- Json数据异步绑定到界面的Table并且自动刷新原理及代码
- LNMP自动安装部署脚本
- mysql 关键词相关度排序方法详细示例分析
- JavaScript中的Object对象学习教程
- jquery tabs的实现代码
- JavaScript 自动分号插入(JavaScript synat:auto semicolon insertion)
- 在光标处插入字符串的实现代码 兼容IE,Firefox
- Java IO流体系继承结构图_动力节点Java学院整理
- 举例讲解Java设计模式中的对象池模式编程
- C#生成随机字符串的实例