Mysql以utf8存储gbk输出的实现方法提供

一个站有可能经历gb2312(gbk,big5)到utf8的转换过程,其中会遇到很多的问题。站点太庞大了怎么办呢,只能一步步来了。要是能在极少改动前端代码的情况下,先完成数据的转换将会使整件事情容易得多。经过几天测试终于发现,Mysql以utf8存储gbk输出是可以实现的。mysql4.1后都有个特性,可以指定当前客户端连接所使用的字符集,mysql默认都是latin1,或由mysql server端配置的字符集进行连接校对。我使用utf8_general_ci来创建字段。 
DB:
SQL代码:


代码如下:

Create TABLE `table` (  
`id` INT( 10 ) NOT NULL ,  
`name` VARCHAR( 50 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,  
INDEX ( `g_id` )   
) ENGINE = innodb CHARACTER SET utf8 COLLATE utf8_general_ci;

PHP:
存储操作指定使用utf8字符集进行连接校对,读取操作指定使用gbk字符集进行连接校对。

PHP代码:


代码如下:

<?php  
        //    Select    DB    And    Set    Link    Use    UTF8  
        function    _select_db_utf()  
        {  
        mysql_select_db($this->db_name,    $this->db_link);

//    init    character  
        mysql_query("SET    NAMES    utf8",    $this->db_link);  
        mysql_query("SET    CHARACTER    SET    utf8",    $this->db_link);  
        mysql_query("SET    COLLATION_CONNECTION='utf8_general_ci'",    $this->db_link);

return    true;  
        }

//    Select    DB    And    Set    Link    Use    GBK  
        function    _select_db_gb()  
        {  
        mysql_select_db($this->db_name,    $this->db_link);

//    init    character  
        mysql_query("SET    NAMES    gbk",    $this->db_link);  
        mysql_query("SET    CHARACTER    SET    gbk",    $this->db_link);  
        mysql_query("SET    COLLATION_CONNECTION='gbk_chinese_ci'",    $this->db_link);

return    true;  
        }  
?>

需要注意几点:
1. mysql必须把gbk,gb2312,utf8等字符集编译进去。
2. 入库的数据内容必须保证是最正确的UTF8编码。
3. 存储和读取操作要指定正确的字符集进行连接校对。

要是前端代码操作数据入库不能以UTF8进行,则需要对字符进行转码了。(例如用AJAX提交的数据便是正确的UTF8,这时是不用转换的。)

因为mb_string是PHP所支持字符最全的,而iconv比它稍差一点,mb_string并不能完全支持一些特殊字符的转码,所以目前为止都没有完美的转码方法。

再次对mb_string和iconv进行比较:

mb_string:
1. 所支持字符最全
2. 内容自动识别编码,不需要确定原来字符的编码,但是执行效率比iconv差太多
3. $content = mb_convert_encoding($content, "UTF-8", "GBK,GB2312,BIG5");(顺序不同效果也有差异)

iconv:
1. 所支持字符不全
2. 需要确定原来字符的编码,但在确定编码的情况下执行效率比mb_convert_encoding高
3. $content = iconv("GBK", "UTF-8", $content);

(0)

相关推荐

  • Mysql以utf8存储gbk输出的实现方法提供

    一个站有可能经历gb2312(gbk,big5)到utf8的转换过程,其中会遇到很多的问题.站点太庞大了怎么办呢,只能一步步来了.要是能在极少改动前端代码的情况下,先完成数据的转换将会使整件事情容易得多.经过几天测试终于发现,Mysql以utf8存储gbk输出是可以实现的.mysql4.1后都有个特性,可以指定当前客户端连接所使用的字符集,mysql默认都是latin1,或由mysql server端配置的字符集进行连接校对.我使用utf8_general_ci来创建字段.  DB: SQL代码

  • MySQL数据库MyISAM存储引擎转为Innodb的方法

    mysql数据库存储引擎为MyISAM的时候,在大访问量的情况下数据表有可能会出现被锁的情况,这就会导致用户连接网站时超时而返回502,此时就需要MySQL数据库MyISAM存储引擎转为Innodb.步骤如下: 1.导出CentOS数据库的表结构 复制代码 代码如下: mysqldump -d -uxxx -p centos > centos_table.sql 其中-d参数表示不导出数据,只导出表结构 2.替换centos_table.sql里的MyISAM为INNODB 复制代码 代码如下:

  • (MariaDB)MySQL数据类型和存储机制全面讲解

    1.1 数据类型概览 数据类型算是一种字段约束,它限制每个字段能存储什么样的数据.能存储多少数据.能存储的格式等.MySQL/MariaDB大致有5类数据类型,分别是:整形.浮点型.字符串类型.日期时间型以及特殊的ENUM和SET类型. 这5种数据类型的意义.限制和相关说明如下图所示: 各数据类型占用字节数,参见mariadb官方手册. 1.2 存储机制和操作方式 数据类型之所以能限定字段的数据存储长度,是因为在创建表时在内存中严格划定了地址空间,地址空间的长度是多少就能存储多少字节的数据.当然

  • MySQL表类型 存储引擎 的选择

    目录 1.查看当前数据库支出的存储引擎 方法1: 方法2: 2.ENGINE={存储引起类型}  创建表的时候,设置存储引擎 3.alter able tablename engine={存储引起类型} 修改表为其他存储引擎 3.1 常用存储引擎的对比 3.2 常用存储引擎学习(MyISAM.InnoDB.MEMORY 和 MERGE) 1.查看当前数据库支出的存储引擎 方法1: mysql> show engines \G; *************************** 1. row

  • PHP数组编码gbk与utf8互相转换的两种方法

    一.利用var_export(), eval()方法 /** * 将含有GBK的中文数组转为utf-8 * * @param array $arr 数组 * @param string $in_charset 原字符串编码 * @param string $out_charset 输出的字符串编码 * @return array */ function array_iconv($arr, $in_charset="gbk", $out_charset="utf-8"

  • Mysql更换MyISAM存储引擎为Innodb的操作记录总结

    一般情况下,mysql会默认提供多种存储引擎,可以通过下面的查看: 1)查看mysql是否安装了innodb插件. 通过下面的命令结果可知,已经安装了innodb插件. mysql> show plugins; +------------+--------+----------------+---------+---------+ | Name | Status | Type | Library | License | +------------+--------+---------------

  • mysql默认编码为UTF-8 通过修改my.ini实现方法

    mysql汉字乱码的原因 mysql默认的编码是Latin1是I-8859-1的别名,但Latin1是不支持汉字的,所以要将其改为UTF-8或GBK 1.关闭mysql服务器,这个很重要. 2.通过my.ini设置mysql数据库的编码 在mysql数据库的安装根目录下找到my.ini,例:C:\Program Files\MySQL\MySQL Server 5.5 将其复制到桌面,双击打开, 搜索"default-character-set"将其改为utf8, 搜索"ch

  • PHP与MYSQL中UTF8编码的中文排序实例

    本文实例讲述了PHP与MYSQL中UTF8编码的中文排序方法,分享给大家供大家参考.具体实现方法如下: 一般来说,中文共有三种排序方式: 1.根据拼音排序: 2.根据笔画排序: 3.根据偏旁排序. 系统的默认排序方式为拼音排序了,这个也是我们常用的,下面介绍的就是按拼音排序了 1. 需要在php数组中用中文排序,但是一般使用utf8格式的文件,直接用asort排序不行.用gbk和gb2312可以.这跟几种格式的编码有关系.gbk和gb2312本身的编码就是用拼音排序的. 复制代码 代码如下: f

  • 全面了解mysql中utf8和utf8mb4的区别

    一.简介 MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode.好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换.当然,为了节省空间,一般情况下使用utf8也就够了. 二.内容描述 那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了.三个字节的 UT

  • PHP与MYSQL中UTF8 中文排序示例代码

    1. 需要在php数组中用中文排序,但是一般使用utf8格式的文件,直接用asort排序不行.用gbk和gb2312可以.这跟几种格式的编码有关系.gbk和gb2312本身的编码就是用拼音排序的. 代码如下 function utf8_array_asort(&$array) { if(!isset($array) || !is_array($array)) { return false; } foreach($array as $k=>$v) { $array[$k] = iconv('U

随机推荐