用PHP实现将GB编码转换为UTF8

gb2utf8.php 文件如下:


代码如下:

<?php
Class GB2UTF8 

var $gb; // 待转换的GB2312字符串 
var $utf8; // 转换后的UTF8字符串 
var $CodeTable; // 转换过程中使用的GB2312代码文件数组 
var $ErrorMsg; // 转换过程之中的错误讯息

function GB2UTF8($InStr="") 

$this->gb=$InStr; 
$this->SetGb2312(); 
($this->gb=="")?0:$this->Convert(); 
}

function SetGb2312($InStr="gb2312.txt") 
{ // 设置gb2312代码文件,默认为gb2312.txt 
$this->ErrorMsg=""; 
$tmp=@file($InStr); 
 if (!$tmp) { 
 $this->ErrorMsg="No GB2312"; 
 return false; 
 } 
$this->CodeTable=array(); 
while(list($key,$value)=each($tmp)) { 
$this->CodeTable[hexdec(substr($value,0,6))]=substr($value,7,6); 

}

function Convert() 
{ // 转换GB2312字符串到UTF8字符串,需预先设置$gb 
$this->utf8=""; 
if(!trim($this->gb) || $this->ErrorMsg!="") { 
return ($this->utf8=$this->ErrorMsg); 

 $str=$this->gb;

while($str) { 
if (ord(substr($str,0,1))>127) 

$tmp=substr($str,0,2); 
$str=substr($str,2,strlen($str)); 
$tmp=$this->U2UTF8(hexdec($this->CodeTable[hexdec(bin2hex($tmp))-0x8080])); 
for($i=0;$i<strlen ($tmp);$i+=3) 
$this->utf8.=chr(substr($tmp,$i,3)); 

else 

$tmp=substr($str,0,1); 
$str=substr($str,1,strlen($str)); 
$this->utf8.=$tmp; 


return $this->utf8; 
}

function U2UTF8($InStr) 

for($i=0;$i<count($InStr);$i++) 
$str=""; 
if ($InStr < 0x80) { 
$str.=ord($InStr); 

else if ($InStr < 0x800) { 
$str.=(0xC0 | $InStr>>6); 
$str.=(0x80 | $InStr & 0x3F); 

else if ($InStr < 0x10000) { 
$str.=(0xE0 | $InStr>>12); 
$str.=(0x80 | $InStr>>6 & 0x3F); 
$str.=(0x80 | $InStr & 0x3F); 

else if ($InStr < 0x200000) { 
$str.=(0xF0 | $InStr>>18); 
$str.=(0x80 | $InStr>>12 & 0x3F); 
$str.=(0x80 | $InStr>>6 & 0x3F); 
$str.=(0x80 | $InStr & 0x3F); 

return $str; 

}
?>

测试文件如下:


代码如下:

<?php
Header("Content-type: image/png"); 
$im = imagecreate(400,300); 
$black = ImageColorAllocate($im, 0,0,0); 
$white = ImageColorAllocate($im, 184,44,6); 
include("gb2utf8.php"); 
$obj=new gb2utf8(); 
$obj->gb="123abc中国456def测试正确"; 
$obj->Convert(); 
ImageTTFText($im, 20, 0, 5, 50, $white, "SIMKAI.TTF", $obj->utf8); 
ImagePNG($im); 
ImageDestroy($im);
?>

说明: 
需要正确设置font文件,请先确认可以使用font直接(不使用gb2utf8)输出英文。

(0)

相关推荐

  • php制作unicode解码工具(unicode编码转换器)代码分享

    复制代码 代码如下: <?phpfunction unicode_encode($name){    $name = iconv('UTF-8', 'UCS-2', $name);    $len = strlen($name);    $str = '';    for ($i = 0; $i < $len - 1; $i = $i + 2)    {        $c = $name[$i];        $c2 = $name[$i + 1];        if (ord($c)

  • php数组编码转换示例详解

    因为一些特殊字符的显示效果的原因不得不把习惯的utf-8工程改成了GBK,由于使用了ajax技术,又涉及到了老问题--编码转换.一些表单验证需要返回json数据,php的json_encode函数只支持utf-8编码,无奈只得iconv了,需要达到的效果是GBK数组转换成utf-8数组传给json_encode函数. 最开始的思路,将数组序列化后用iconv函数转换编码,之后再反序列化,代码如下: 复制代码 代码如下: unserialize(iconv('gbk','utf-8',serial

  • 基于php导出到Excel或CSV的详解(附utf8、gbk 编码转换)

    php导入到excel乱码是因为utf8编码在xp系统不支持所有utf8编码转码一下就完美解决了utf-8编码案例Php代码 复制代码 代码如下: <?php header("Content-Type: application/vnd.ms-excel; charset=UTF-8"); header("Pragma: public"); header("Expires: 0"); header("Cache-Control: m

  • 浅析PHP中的字符串编码转换(自动识别原编码)

    复制代码 代码如下: /** * 对数据进行编码转换 * @param array/string $data       数组 * @param string $output    转换后的编码 */function array_iconv($data,$output = 'utf-8') { $encode_arr = array('UTF-8','ASCII','GBK','GB2312','BIG5','JIS','eucjp-win','sjis-win','EUC-JP'); $enc

  • PHP 解决utf-8和gb2312编码转换问题

    终于皇天不负有心人,答案还是让我找到了. 网上的都是这样用的 复制代码 代码如下: $content = iconv("utf-8","gb2312",$content); 这样做其实也对着了,看着确实是把utf-8转化为gb2312了,但是实际运行的话,往往都是以失败告终的,原因呢? 原因实际上也很简单,因为任何的函数都是执行错误的时候,同时很不幸的是iconv();就很终于出现错误.现在给你正确的答案. 真正的答案是这样的 复制代码 代码如下: $content

  • PHP iconv 解决utf-8和gb2312编码转换问题

    终于皇天不负有心人,答案还是让我找到了. 网上的都是这样用的 复制代码 代码如下: $content = iconv("utf-8","gb2312",$content); 这样做其实也对着了,看着确实是把utf-8转化为gb2312了,但是实际运行的话,往往都是以失败告终的,原因呢? 原因实际上也很简单,因为任何的函数都是执行错误的时候,同时很不幸的是iconv();就很终于出现错误.现在给你正确的答案. 真正的答案是这样的 复制代码 代码如下: $content

  • php字符编码转换之gb2312转为utf8

    在php中字符编码转换我们一般会用到iconv与mb_convert_encoding进行操作,但是mb_convert_encoding在转换性能上比iconv要差很多哦.string iconv ( string in_charset, string out_charset, string str ) 注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符

  • PHP编码转换

    SELECT COLLATIONPROPERTY('Chinese_PRC_Stroke_CI_AI_KS_WS', 'CodePage') 返回为936,即GBK编码. 936 简体中文GBK 950 繁体中文BIG5 437 美国/加拿大英语 932 日文 949 韩文 866 俄文 65001 unicode UFT-8 如果字段有中文,PHP文件设置编码为GBK2312,则取数据库信息时没有问题: print_r($rs["客户编码"]); 如果PHP文件设置编码为utf-8,

  • 用php实现gb2312和unicode间的编码转换

    gb2312 和 unicode 间的编码转换 下面的例子是将 gb2312 转换为 "全"这种形式 php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode的转换函数 查表(gb2312.txt)也行 复制代码 代码如下: <? $text = "我们"; preg_match_all("/[\x80-\xff]?./",$text,$ar); foreach($ar[0] as $v) echo &quo

  • PHP编码转换函数 自动转换字符集支持数组转换

    复制代码 代码如下: // 自动转换字符集 支持数组转换 function auto_charset($fContents, $from='gbk', $to='utf-8') { $from = strtoupper($from) == 'UTF8' ? 'utf-8' : $from; $to = strtoupper($to) == 'UTF8' ? 'utf-8' : $to; if (strtoupper($from) === strtoupper($to) || empty($fCo

  • PHP下编码转换函数mb_convert_encoding与iconv的使用说明

    不过英文一般不会存在编码问题,只有中文数据才会有这个问题.比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码. mb_convert_encoding的用法见官方: http://cn.php.net/manual/zh/function.mb-convert-encoding.php 做一个GBK To UTF-8 复制代码 代码如下: <?php header(&qu

随机推荐