PHP乱码问题，UTF-8乱码常见问题小结

2025-04-03 02:13:41

一.HTML页面转UTF-8编码问题
1.在head后，title前加入一行：

显示的标题有可能是乱码！

2.html文件编码问题:

点击编辑器的菜单：“文件”->“另存为”，可以看到当前文件的编码，确保文件编码为：UTF-8，
如果是ANSI，需要将编码改成：UTF-8。
3.HTML文件头BOM问题：
将文件从其他的编码转换成UTF-8编码时，有时候会在文件的最开始加上一个BOM标签，
在个BOM标签可能会导致浏览器在显示中文的时候出现乱码。
删除这个BOM标签的方法：
1.可以用Dreamweaver打开文件，并重新保存，即可以去除BOM标签！
2.可以用EditPlus打开文件，并在菜单“首选项”->“文件”->"UTF-8标识"，设置为：“总是删除签名”，
然后保存文件，即可以去除BOM标签！
4.WEB服务器UTF-8编码问题：
如果你按以上所列的步骤做了，还是有中文乱码问题，
请检查你的所使用的WEB服务器的编码问题
如果你使用的是Apache，请将配置文件里的：charset 设成：utf-8(这里仅列出方法，具体格式请参考apache的配置文件)
如果你使用的是Nginx，请将nginx.conf里的：charset 设成 utf-8，
具体找到 "charset gb2312;"或者类似的语句，改成：“charset utf-8;”。
二.PHP页面转UTF-8编码问题
1.在代码开始出加入一行：
header("Content-Type: text/html;charset=utf-8");

2.PHP文件编码问题

点击编辑器的菜单：“文件”->“另存为”，可以看到当前文件的编码，确保文件编码为：UTF-8，
如果是ANSI，需要将编码改成：UTF-8。
3.PHP文件头BOM问题：
PHP文件一定不可以有BOM标签
否则，会出现session不能使用的情况，并有类似的提示：
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
这是因为，在执行session_start() 的时候，整个页面不能有输出，但是当由于前PHP页面存在BOM标签，
PHP把这个BOM标签当成是输出了，所以就出错了！
所以PHP页面一定要删除BOM标签
删除这个BOM标签的方法：
1.可以用Dreamweaver打开文件，并重新保存，即可以去除BOM标签！
2.可以用EditPlus打开文件，并在菜单“首选项”->“文件”->"UTF-8标识"，设置为：“总是删除签名”，
然后保存文件，即可以去除BOM标签！
4.PHP以附件形式保存文件的时候，UTF-8编码问题：
PHP以附件形式保存文件，文件名必须是GB2312编码，
否则，如果文件名中有中文的话，将是显示乱码：
如果你的PHP本身是UTF-8编码格式的文件，
需要将文件名变量由UTF-8转成GB2312：
iconv("UTF-8", "GB2312", "$filename");

5.截断显示文章标题时，出现乱码或者“？”问号的问题：
一般文章标题很长的时候，会显示一部分标题，会对文章标题进行截断，
由于一个UTF-8编码格式的中文字符会占用3个字符宽度，
截取标题的时候，有时会只截取到一个中文字符的1个字符或2字符宽度，
没截取完整，将出现乱码或“？”问号的情况，
用下面的函数截取标题，就不会有问题：

代码如下:

function get_brief_str($str, $max_length)
{
echo strlen($str) ."<br>";
if(strlen($str) > $max_length)
{
$check_num = 0;
for($i=0; $i < $max_length; $i++)
{
if (ord($str[$i]) > 128)
$check_num++;
}

if($check_num % 3 == 0)
$str = substr($str, 0, $max_length)."...";
else if($check_num % 3 == 1)
$str = substr($str, 0, $max_length + 2)."...";
else if($check_num % 3 == 2)
$str = substr($str, 0, $max_length + 1)."...";
}
return $str;
}

三.MYSQL数据库使用UTF-8编码的问题

1.用phpmyadmin创建数据库和数据表
创建数据库的时候，请将“整理”设置为：“utf8_general_ci”
或执行语句：

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
创建数据表的时候：如果是该字段是存放中文的话，则需要将“整理”设置为：“utf8_general_ci”，

如果该字段是存放英文或数字的话，默认就可以了。

相应的SQL语句，例如：

代码如下:

CREATE TABLE `test` (
`id` INT NOT NULL ,
`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM ;

2.用PHP读写数据库

在连接数据库之后：

[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);

加入两行：

代码如下:

mysql_query("set character set 'utf8'");//读库
mysql_query("set names 'utf8'");//写库

就可以正常的读写MYSQL数据库了。

四.JS相关的UTF-8编码问题
1.JS读Cookie的中文乱码问题

PHP写cookie的时候需要将中文字符进行escape编码，
否则JS读到cookie中的中文字符将是乱码。
但php本身没有escape函数，我们新写一个escape函数：

代码如下:

function escape($str)
{
preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r);
$ar = $r[0];
foreach($ar as $k=>$v)
{
if(ord($v[0]) < 128)
$ar[$k] = rawurlencode($v);
else
$ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v));
}
return join("",$ar);
}

JS读cookie的时候，用unescape解码，

然后就解决cookie中有中文乱码的问题了。

2.外部JS文件UTF-8编码问题

当一个HTML页面或则PHP页面包含一个外部的JS文件时，

如果HTML页面或则PHP页面是UTF-8编码格式的文件，

外部的JS文件同样要转成UTF-8的文件，

否则将出现，没有包含不成功，调用函数时没有反应的情况。

点击编辑器的菜单：“文件”->“另存为”，可以看到当前文件的编码，确保文件编码为：UTF-8，

如果是ANSI，需要将编码改成：UTF-8。

五.FLASH相关的UTF-8编码问题

FLASH内部对所有字符串，默认都是以UTF-8处理
1.FLASH读文普通本文件(txt,html)
要将文本文件的编码存为UTF-8
点击编辑器的菜单：“文件”->“另存为”，可以看到当前文件的编码，确保文件编码为：UTF-8，
如果是ANSI，需要将编码改成：UTF-8。
2.FLASH读XML文件
要将XML文件的编码存为UTF-8
点击编辑器的菜单：“文件”->“另存为”，可以看到当前文件的编码，确保文件编码为：UTF-8，
如果是ANSI，需要将编码改成：UTF-8。
在XML第1行写：

3.FLASH读PHP返回数据
如果PHP编码本身是UTF-8的，直接echo就可以了
如果PHP编码本身是GB2312的，可以将PHP转存成UTF-8编码格式的文件，直接echo就可以了
如果PHP编码本身是GB2312的，而且不允许改文件的编码格式，
用下面的语句将字符串转换成UTF-8的编码格式
$new_str = iconv("GB2312", "UTF-8", "$str");
再echo就可以了
4.FLASH读数据库(MYSQL)的数据
FLASH要通过PHP读取数据库中的数据
PHP本身的编码不重要，关键是如果数据库的编码是GB2312的话，
需要用下面的语句将字符串转换成UTF-8的编码格式
$new_str = iconv("GB2312", "UTF-8", "$str");

5.FLASH通过PHP写数据
一句话，FLASH传过来的字符串是UTF-8格式的，
要转换成相应的编码格式，再操作（写文件、写数据库、直接显示等等）
还是用iconv函数转换
6.FLASH使用本地编码(理论上不推荐使用)
如果想让FLASH不使用UTF-8编码，而是使用本地编码
对于中国大陆地区而言，本地编码是GB2312或GBK
AS程序内，可以添加以下代码：
System.useCodepage = true;
那么FLASH内所有字符都是使用GB2312的编码了
所有导入到FLASH或者从FLASH导出的数据，都应该做相应的编码转换
因为使用本地编码，会造成使用繁体中文地区的用户产生乱码，所以不推荐使用

php中utf-8编码下用正则表达式如何匹配汉字

在javascript中,要判断字符串是中文是很简单的.比如: 复制代码代码如下: var str = "php编程"; if (/^[\u4e00-\u9fa5]+$/.test(str)) { alert("该字符串全部是中文"); } else { alert("该字符串不全部是中文"); } 想当然的,在php中来判断字符串是否为中文,就会沿袭这个思路: 复制代码代码如下: <?php $str = "php编程&qu
php中文乱码怎么办如何让浏览器自动识别utf-8

刚开始学习php的朋友可能经常遇到问题,就是调试的时候经常显示乱码每次打开浏览器都要改下编码,很麻烦, 有没有方法让浏览器自动识别utf-8呢? 解决的方法很简单就是在php里加一句header 例: header("Content-type: text/html; charset=utf-8"); echo '我是初学者'; 不错需要注意的一点是 header("Content-type: text/html; charset=utf-8"); 这一句前不能向
PHP iconv 解决utf-8和gb2312编码转换问题

终于皇天不负有心人,答案还是让我找到了. 网上的都是这样用的复制代码代码如下: $content = iconv("utf-8","gb2312",$content); 这样做其实也对着了,看着确实是把utf-8转化为gb2312了,但是实际运行的话,往往都是以失败告终的,原因呢? 原因实际上也很简单,因为任何的函数都是执行错误的时候,同时很不幸的是iconv();就很终于出现错误.现在给你正确的答案. 真正的答案是这样的复制代码代码如下: $content
PHP 截取字符串函数整理(支持gb2312和utf-8)

1.截取GB2312字符用的函数 PHP代码复制代码代码如下: <?php //截取中文字符串 function mysubstr($str, $start, $len) { $tmpstr = ""; $strlen = $start + $len; for($i = 0; $i < $strlen; $i++) { if(ord(substr($str, $i, 1)) > 0xa0) { $tmpstr .= substr($str, $i, 2); $i+
PHP 与 UTF-8 的最佳实践详细介绍

<PHP中的字符串.编码.UTF-8>一文中描述了一些列的基础知识,比较枯燥,现在来说点有用的--PHP 字符串处理的最佳实践,本文是"PHP.字符串.编码.UTF-8"相关知识的第二部分.先说结论-- 在 PHP 中的各个方面使用 UTF-8 编码. PHP 语言层面是不支持 Unicode字符集的,但是可以通过 UTF-8 编码能处理大部分问题. 最佳实践就是明确知道输入编码(不知道就检测),内部统一转换为 UTF-8 编码,输出编码也统一是 UTF-8编码. PHP
php utf-8转unicode的函数第1/2页

UTF编码 UTF-8就是以8位为单元对UCS进行编码.从UCS-2到UTF-8的编码方式如下: UCS-2编码(16进制) UTF-8 字节流(二进制) 0000 - 007F 0xxxxxxx 0080 - 07FF 110xxxxx 10xxxxxx 0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx 例如"汉"字的Unicode编码是6C49.6C49在0800-FFFF之间,所以肯定要用3字节模板了:1110xxxx 10xxxxxx 10xxxxx
php UTF-8、Unicode和BOM问题

一.介绍 UTF-8 是一种在web应用中经常使用的一种 Unicode 字符的编码方式,使用 UTF-8 的好处在于它是一种变长的编码方式,对于 ANSII 码编码长度为1个字节,这样的话在传输大量 ASCII 字符集的网页时,可以大量节约网络带宽. UTF-8签名(UTF-8 signature)也叫做BOM(Byte Order Mark),是UTF编码方案里用于标识编码的标准标记.BOM,是UTF编码方案里用于标识编码的标准标记,在UTF-16里本来是FF FE,变成UTF-8就成了EF
php中隐形字符65279（utf-8的BOM头）问题

今天在CSDN看到一个php输出空白隐形字符65279的问题,在网上找了下,发下这个65279字符是php用来标记文件是utf-8编码的,输出的时候会一起输出到客户端,导致客户端如果使用ajax得到返回值时,无法匹配字符串. php隐形字符65279解释如下: UTF-8 编码的文件可以分为无 BOM 和 BOM 两种格式. 何谓BOM? "EF BB BF" 这三个字节就叫BOM,全称是"Byte Order Mard".在utf8文件中常用BOM来表明这个文件是
PHP utf-8编码问题,utf8编码,数据库乱码,页面显示输出乱码

老声长谈,着是困惑很多人的问题,如果处理不好,都是乱码,说这些话并不是我对编码很精通,只是在这方面是得留神,自己总结了一点小经验(容易出现乱码的地方有php文件里面 ,数据库里面存储的编码 ,页面显示 ,数据传输 ): 1.在建数据库的时候,尤其是用phpMyAdmin与MYSQL打交道时候,一般都是utf-8,字段为 utf8_general_ci 数据库的设置: 在my.ini文件中查找:[mysql]default-character-set = utf8[mysqld]default
php中json_encode UTF-8中文乱码的更好解决方法

最近在接口代码当中用到过json_encode,在网上找到说json_encode编码设置为UTF-8中文就不会乱码,经验证这办法确实是有效果的,但是不知道为什么,代码在用过一段时间之后就不太管用了.以下是自己的解决json_encode的办法.有更好的方法请分享出来吧! 第一种: 这种简单的做一个代码转换,urlcode之后再返回所需数组我代码这样就足够了. 代码如下复制代码 public static function encodeOperations ($array) { foreac
jq的get传参数在utf-8中乱码问题的解决php版

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-
PHP如何实现Unicode和Utf-8编码相互转换

最近恰好要用到unicode编码的转换,就去查了一下php的库函数,居然没找到一个函数可以对字符串进行Unicode的编码和解码!也罢,找不到的话就自己实现一下了... Unicode和Utf-8编码的区别 Unicode是一个字符集,而UTF-8是Unicode的其中一种,Unicode是定长的都为双字节,而UTF-8是可变的,对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节.Unicode为双字节,而UTF-8中汉字占三个字节. UTF-8编码字符理论上可以最多到6个字节
php smarty截取中文字符乱码问题?gb2312/utf-8

一般网站页面的显示都不可避免的会涉及子字符串的截取,这个时候truncate就派上用场了,但是它只适合英文用户,对与中文用户来说,使用 truncate会出现乱码,而且对于中文英文混合串来说,截取同样个数的字符串,实际显示长度上却不同,视觉上会显得参差不齐,影像美观.这是因为一个中文的长度大致相当与两个英文的长度.此外,truncate也不能同时兼容GB2312, UTF-8等编码. 改良的smartTruncate: 文件名:modifier.smartTruncate.php 复制代码代码

PHP乱码问题，UTF-8乱码常见问题小结

相关推荐

随机推荐