mysql charset=utf8你真的弄明白意思了吗

2025-01-29 07:15:06

1、先来查看一个建表语句

create table student(
  sid int primary key aotu_increment,
  sname varchar(20) not null,
  age int
)charset=utf8;

思考一个问题：

当我们建表时，不指定charset=utf8的时候，此时插入中文，为什么会报错呢？
当指定charset=utf8后，再次插入中文，为什么又可以插入中文，并且不乱码呢？

2、查看CMD黑窗口的字符集

打开CMD黑窗口–>鼠标放在窗口最上方–>点击鼠标右键–>属性–>点击选项

通过上图可以知道：CMD中输入文字使用的字符编码是GBK。同时你在保存文件的时候，经常会看到ANSI字符集，这个代表的是本地字符集，我们在中国，本地字符集使用的就都是GBK编码。

3、你注意这个问题了吗？

客户端client输入的字符，都是采用GBK编码的。mysql服务器存储的字符又是UTF8编码的。那么，我们对数据库、表进行增删改查，最后返回到客户端界面中，要想保证字符不乱码，肯定是经过了"编码转换过程的"。我要问的是，究竟是什么东西完成了这个编码的转换过程的？

4、你不熟悉的几个mysql操作命令

-- 查看数据库支持的所有的字符集(这句命令自己下去操作)。
mysql> show character set;
-- 查看系统当前状态，里面可以看到部分字符集设置。
mysql> status;
-- 查看系统字符集设置，包括所有的字符集设置
mysql> show variables like '%char%';

操作结果如下：

通过上图我们可以看到有一个叫做"connection"的东西，中文名叫做"连接器"。"连接器"就是用来进行"编码转换过程"的。

1）连接器的特性

① “连接器的作用”：

连接客户端与服务端，进行字符集的转换。连接器有这种自动转换的功能。

② “连接器的工作流程”：
Ⅰ首先，客户端的字符先发给连接器，连接器选择一种编码将其转换(转换之后的编码，与连接器的编码格式一致)，进行临时存储。
Ⅱ 接着，连接器再次转换成与服务器一致的编码，并最终存储在服务器中。
Ⅲ 然后，服务器返回的结果，再次先通过连接器，连接器仍然是选择一种编码将其转换(转换之后的编码，与连接器的编码格式一致)，进行临时存储。
Ⅳ 最后，连接器再将结果转化为与客户端一致的字符集，就可以在客户端正常显示了。

2）图示说明连接器connection的作用

图一：

图一说明如下：

图二：

图二说明如下：

5、对上述两个图的实战演示

1）首先，了解如下几个代码。

-- 1）设置客户端的字符集。
set character_set_client=gbk;
-- 2）设置连接器的字符集。
set character_set_connection=utf8;
-- 3）设置返回结果的字符集。
set character_set_results=gbk;

2）代码演示过程，详细地写在如下链接中的sql文件中，可以自行下载，查看。

http://note.youdao.com/noteshare?id=3fe60a490637d1a51ac78bf4a9e7e4d0&sub=511D73BDDEA34D9BAC565249035D74A8

6、产生乱码的两个原因

解码与实际编码，不一致导致的乱码，可修复。

在传输过程中，由于编码不一致，导致部分字节丢失，造成的乱码，不可修复。

1）编码和解码不一致导致的乱码

2）传输过程中，丢失字节导致的乱码。

7、对实际情况的分析(什么都不设置，系统默认是如何呢？)

1）仔细查看如下图片

根据上图可以知道(好好理解下面的文字说明)：

图二：

2）set names gbk的含义

-- 当客户端、连接器、返回值的字符集相同，并且都是gbk的时候，我们可以采取如下的简写方式：
 set names gbk;
 -- 上述sql语句其实包含了如下三层意思：
 set character_set_client=gbk;
 set character_set_connection=gbk;
 set character_set_results=gbk;

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们

MySQL的中文UTF8乱码问题

从MySQL支持Unicode后,为了与时俱进,我们的web程序也开始考虑用UTF8了.其实UTF8也用了好几年了,程序基本能跑,没什么大问题,但是数据倒换的时候,总是遇到不爽的事情. [问题现象] 网页xxx.php用EditPlus另存为UTF8格式,MySQL在my.ini里设置default-character-set=utf8,建表时加了CREATE TABLE `xxx ` (myname varchar(255)) ENGINE=MyISAM DEFAULT CHARSET=utf
查看修改mysql编码方式让它支持中文(gbk或者utf8)

MySQL的默认编码是Latin1,不支持中文,要支持中文需要把数据库的默认编码修改为gbk或者utf8. 1.需要以root用户身份登陆才可以查看数据库编码方式(以root用户身份登陆的命令为:>mysql -u root –p,之后两次输入root用户的密码),查看数据库的编码方式命令为: >show variables like 'character%'; +--------------------------+----------------------------+ | Variab
mysql 字符串长度计算实现代码(gb2312+utf8)

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员.下面简要的剖析一下PHP对中文字符串长度的处理: PHP自带的函数如strlen().mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节.例: $enStr = 'Hello,China!'; echo strlen($enStr); // 输出:12 而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8.utf-8能兼容更多的字符,所以受到很多站长的喜爱.gbk与
MAC下修改mysql默认字符集为utf8的方法

1,检查默认安装的mysql的字符集 mysql> show variables like '%char%'; +--------------------------+--------------------------------------------------------+ | Variable_name | Value | +---------------------
Mysql以utf8存储gbk输出的实现方法提供

一个站有可能经历gb2312(gbk,big5)到utf8的转换过程,其中会遇到很多的问题.站点太庞大了怎么办呢,只能一步步来了.要是能在极少改动前端代码的情况下,先完成数据的转换将会使整件事情容易得多.经过几天测试终于发现,Mysql以utf8存储gbk输出是可以实现的.mysql4.1后都有个特性,可以指定当前客户端连接所使用的字符集,mysql默认都是latin1,或由mysql server端配置的字符集进行连接校对.我使用utf8_general_ci来创建字段. DB: SQL代码
完美转换MySQL的字符集解决查看utf8源文件中的乱码问题

MySQL从4.1版本开始才提出字符集的概念,所以对于MySQL4.0及其以下的版本,他们的字符集都是Latin1的,所以有时候需要对mysql的字符集进行一下转换,MySQL版本的升级.降级,特别是升级MySQL的版本,为了不让程序继续沿用Latin1字符集之后对以后Discuz!版本升级的影响和安装SupeSite,这就需要我们进行字符集的转换! 本人转换过好多数据了,也用过了好多的办法,个人感觉最好用的就是使用MySQL命令导出导入中将字符集转换过去! 现在我将用图文并茂的方式向大家展示一
PHP MYSQL乱码问题,使用SET NAMES utf8校正

先记下,免得以后想不起来又到处去找! PHP操作数据库的时候,数据库中数据使用UTF8编码,在读出来的时候,显示的全是???????问号乱码,找了一些资料原来是在读取之前进行一次编码设置: 复制代码代码如下: create table tablename ( id int not null auto_increment, title varchar(20) not null, contnet varchar(300) defalut null, primary key ('id') )begi
MySQL字符集 GBK、GB2312、UTF8区别解决MYSQL中文乱码问题

MySQL中涉及的几个字符集 character-set-server/default-character-set:服务器字符集,默认情况下所采用的. character-set-database:数据库字符集. character-set-table:数据库表字符集. 优先级依次增加.所以一般情况下只需要设置character-set-server,而在创建数据库和表时不特别指定字符集,这样统一采用character-set-server字符集. character-set-client:客户
mysql存储emoji表情报错的处理方法【更改编码为utf8mb4】

本文实例分析了mysql存储emoji表情报错的处理方法.分享给大家供大家参考,具体如下: utf-8编码可能2个字节.3个字节.4个字节的字符,但是MySQL的utf8编码只支持3字节的数据,而移动端的表情数据是4个字节的字符.如果直接往采用utf-8编码的数据库中插入表情数据,Java程序中将报SQL异常: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\x94' for column 'name' at row 1
MySql修改数据库编码为UTF8避免造成乱码问题

mysql 创建数据库时指定编码很重要,很多开发者都使用了默认编码,乱码问题可是防不胜防.制定数据库的编码可以很大程度上避免倒入导出带来的乱码问题. 网页数据一般采用UTF8编码,而数据库默认为latin .我们可以通过修改数据库默认编码方式为UTF8来减少数据库创建时的设置,也能最大限度的避免因粗心造成的乱码问题. 我们遵循的标准是,数据库,表,字段和页面或文本的编码要统一起来我们可以通过命令查看数据库当前编码: mysql> SHOW VARIABLES LIKE 'character%'

mysql charset=utf8你真的弄明白意思了吗

相关推荐

随机推荐