MySQL 中字符集详细介绍

目录
  • MySQL 中的 UTF8
  • 修改MySQL数据库的编码
  • 字符集的比较规则
  • MySQL查询时区分大小写

MySQL 中的 UTF8

在 MySQL 中, utf8 编码格式有点特殊, 它不是我们通常用到的 utf8, 而是 utf8mb3 编码的缩写. 而 utf8mb4 才是我们常说的那个 utf8.

  • utf8mb3:阉割过的 utf8 字符集, 只使用 1~3 个字节表示字符.
  • utf8mb4:正宗的 utf8 字符集, 使用 1~4 个字节表示字符.

通常情况下, utf8mb3 和 utf8mb4 的使用区别不大, 但是如果有使用 4 字节编码一个字符的情况, 比如存储一些 emoji 表情, 那就必须使用 utf8mb4 编码.

修改MySQL数据库的编码

当我们 MySQL 数据库的编码已经是UTF8 时, 此时需要对某个表的某个字段支持插入emoji 表情,前面说过 emoji 表情需要 utf8mb4 才支持。所以此时就需要修改 MySQL 的编码。

注意:utf8mb4 字符集要求 MySQL 数据库版本 >=5.5.3

修改的步骤如下:

1.修改 mysql 配置文件,设置其编码格式,添加或修改如下代码:

[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect = 'SET NAMES utf8mb4'
character-set-client-handshake = false
[client]
default-character-set=utf8mb4
[mysql]
default-character-set=utf8mb4

2.修改数据库字符集编码

-- 设置指定数据库的字符集编码,xxx 为数据库名称
ALTER DATABASE xxx CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

3.修改数据表字符集编码

-- 设置指定数据表的字符集编码
ALTER TABLE xxx.yyy CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

4.检测是否修改成功

SHOW VARIABLES WHERE Variable_name LIKE 'character%' OR Variable_name LIKE 'collation%';

5.插入一个emoji表情来测试下:

UPDATE yyy SET comments = '测试表情' WHERE id = 1;

字符集的比较规则

MySQL 有 4 个级别的字符集, 分别是: 服务器级别, 数据库级别, 表级别, 列级别。同时对应了4个级别的比较规则,即服务器级别, 数据库级别, 表级别, 列级别。

每种字符集对应若干种比较规则, 且每种字符集都有一种默认的比较规则。

通过 SHOW COLLATION 命令的结果中的 Default 列的值为 YES 的就是该字符集的默认比较规则, 对于 utf8 字符集,默认的比较规则就是 utf8_general_ci. ( ci 表示不区分大小写 )

  • utf8_general_ci 表示不区分大小写
  • utf8_general_cs 表示区分大小写

上面说到,一种字符集对应多个比较规则,常见的比较规则 utf8_unicode_ci 和 utf8_general_ci 的区别:

  • 对中英文来说没有实质的差别。
  • utf8_general_ci: 校对速度快,但准确度稍差。
  • utf8_unicode_ci: 准确度高,但校对速度稍慢。
  • 若数据库中有德语、法语或者俄语需求,需使用 utf8_unicode_ci。其他情况用 utf8_general_ci 即可。

MySQL查询时区分大小写

上面说到,MySQL 默认是不区分大小写的,平时也很少会考虑数据存储时是否区分字符串的大小写。不过,有时候还是会明确要求某张表的指定字段在查询时需要区分大小写。

那么如何实现呢?

  • 方式1:在建表的时候,就设置比较规则区分大小写。但个人认为最好不要这么做。一般在设计数据库时并不能很明确的知道哪个字段需要区分,都是在开发一段时间后,突然提出的。具有难以预料性。
  • 方式2:是在执行查询 SQL 时添加关键字 binary 可以区分大小写。
-- 查询结果是相同的,不分区大小写
SELECT * FROM U WHERE name LIKE 'a%';
SELECT * FROM U WHERE name LIKE 'A%';

-- 查询结果是不同的,区分大小写
SELECT * FROM U WHERE binary name LIKE 'a%';
SELECT * FROM U WHERE binary name LIKE 'A%';

到此这篇关于MySQL 中字符集详细介绍的文章就介绍到这了,更多相关MySQL 字符集内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • MySQL修改默认引擎和字符集详情

    目录 一.数据库引擎 1.1 查看数据库引擎 1.2 修改默认数据库引擎 二.数据库字符集 2.1 查看字符集 2.2 修改字符集 一.数据库引擎 1.1 查看数据库引擎 mysql> show engines; +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+ | Engine |

  • Linux系统下修改mysql字符集为UTF8步骤

    目录 1.数据库中查看MySQL状态: 2.修改配置文件: 3.若是还没成功,可能是创建mysql时的配置或者刚上一步MySQL没有停止服务编辑 my.cnf 配置文件. Linux上修改MySQL字符编码为UTF8 开始在linux上装好了MySQL服务,在后期的使用过程中,突然发现在插入记录时,部分字段不能为中文,报错信息如下: mysql> insert into syudent values(1,'陶盼',21); ERROR 1366 (HY000): Incorrect string

  • MySQL数据库之字符集 character

    目录 一.字符集 character 二.设置客户端字符集 一.字符集 character 字符 character 是各种文字和符号的总称 字符编码 character code 是计算机针对各种符号,在计算机中的一种二进制存储代号 字符集character set 是多个字符的集合 常见的字符集: ASCII 字符集 GB2312 字符集 Unicode 字符集 二.设置客户端字符集 -- 设置客户端字符集编码 set names gbk; -- 查看字符集编码设置 show variabl

  • Mysql 字符集不一致导致连表异常的解决

    目录 1. 解决方法 2. mysql字符集 字符集 校验规则 做一个简单的如下的连表查询,居然直接提示错误,居然是字符集不一致的问题,本文记录一下mysql的字符集类型,以及下面这个问题的解决方案 select a.id, b.id from tt as a, t2 as b where a.xx = b.xx -- Illegal mix of collations (utf8mb4_unicode_ci,IMPLICIT) and (utf8mb4_general_ci,IMPLICIT)

  • 详解mysql中的字符集和校验规则

    1几种常见字符集 在MySQL中,最常见的字符集有ASCII字符集.latin字符集.GB2312字符集.GBK字符集.UTF8字符集等,下面我们简单介绍下这些字符集: ASCII字符集 这个字符集使用1个字节进行编码,一个字节具有8位,总共可以保存128个字符,具体的对应关系如下: latin字符集 latin字符集一共可以保存256个字符,相比ASCII码,它又包含了128个西欧常用字符. GB2312字符集 它包含了中文汉字.拉丁字符.希腊字符等,其中汉字占了大多数,有6763个,其他文字

  • mysql字符集相关总结

    这边笔记主要记录一下对mysql字符集相关知识的学习 字符集 一般我们使用如下语句创建一张表,创建表的时候指定了charset为utf8编码. CREATE TABLE `test` ( `c1` int UNSIGNED NOT NULL AUTO_INCREMENT, `c2` varchar(255), `c3` char(11), `c4` varchar(255), PRIMARY KEY (`c1`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; 但其实

  • MySQL修改字符集的实战教程

    前言: 在 MySQL 中,系统支持诸多字符集,不同字符集之间也略有区别.目前最常用的字符集应该是 utf8 和 utf8mb4 了,相比于 utf8 ,utf8mb4 支持存储 emoji 表情,使用范围更广.本篇文章将会介绍 utf8 修改成 utf8mb4 字符集的方法. 1. utf8 和 utf8mb4 字符集介绍 字符(Character)是各种文字和符号的总称,包括各国家文字.标点符号.图形符号.数字等.字符集(Character set)是多个字符的集合. MySQL 中字符集可

  • MYSQL字符集设置的方法详解(终端的字符集)

    前言 每次利用终端 创建数据库或者创建表的时候,字符集都是latin1,或者进行插入值的时候,显示的是乱码(不指定字符集的时候)如下: 查看当前数据库的字符集 character_set_client:客户端请求数据的字符集 character_set_connection:客户机/服务器连接的字符集 character_set_database:默认数据库的字符集,无论默认数据库如何改变,都是这个字符集:如果没有默认数据库,那就使用 character_set_server指定的字符集,这个变

  • MySQL字符集utf8修改为utf8mb4的方法步骤

    对于mysql 5.5 而言,如果不设定字符集,mysql默认的字符集是 latin1 拉丁文字符集: 但随着各种业务的进一步发展,除了各个国家的本身语言字符,经常也会有一些表情符号出现在应用程序中,而在mysql 5.5 之前,UTF-8编码只支持1-3个字节,支持BMP这部分的Unicode编码区:从MySQL 5.5开始,可以支持4个字节UTF编码 utf8mb4 ,一个字符能够支持更多的字符集,也能够支持更多表情符号. utf8mb4兼容utf8,且比utf8能表示更多的字符,是utf8

  • MySQL 中字符集详细介绍

    目录 MySQL 中的 UTF8 修改MySQL数据库的编码 字符集的比较规则 MySQL查询时区分大小写 MySQL 中的 UTF8 在 MySQL 中, utf8 编码格式有点特殊, 它不是我们通常用到的 utf8, 而是 utf8mb3 编码的缩写. 而 utf8mb4 才是我们常说的那个 utf8. utf8mb3:阉割过的 utf8 字符集, 只使用 1-3 个字节表示字符. utf8mb4:正宗的 utf8 字符集, 使用 1-4 个字节表示字符. 通常情况下, utf8mb3 和

  • Mysql中Identity 详细介绍

    假如表中包含一列为auto_increment, 如果是Myisam类型的引擎,那么在删除了最新一笔数据,无论是否重启Mysql,下一次插入之后仍然会使用上次删除的最大ID+1. mysql> create table test_myisam (id int not null auto_increment primary key, name char(5)) engine=myisam; Query OK, 0 rows affected (0.04 sec) mysql> insert in

  • Mysql中复制详细解析

    1.mysql复制概念 指将主数据库的DDL和DML操作通过二进制日志传到复制服务器上,然后在复制服务器上将这些日志文件重新执行,从而使复制服务器和主服务器的数据保持同步.复制过程中一个服务器充当主服务器(master),而一个或多个其它服务器充当从服务器(slaves).主服务器将更新重新写入二进制日志文件,并维护文件的一个索引以跟踪日志循环.这些日志可以记录发送到从服务器的更新.当一个从服务器连接主服务器时,它通知主服务器.从服务器在日志中读取的最后一次成功更新的位置.从服务器接受从那时起发

  • MySql约束超详细介绍

    目录 1. 什么是约束 2. 约束包括哪些 3. 非空约束 4. 唯一性约束 1. 单字段唯一性约束 2. 多字段唯一性约束 5. 主键约束 1. 主键约束的相关术语 2. 什么是主键以及有啥用 3. 单一主键 4. 复合主键 5. 其他主键 6. 外键约束 1. 外键约束的相关术语 2. 外键出现的原因 3. 创建外键表 1. 什么是约束 约束对应的英语单词:constraint 在创建表的时候,我们可以给表中的字段加上一些约束,来保证表中的数据的完整性.有效性!!! 约束的作用就是为了保证:

  • python中进程间通信详细介绍

    目录 进程间通信(IPC) 管道通信(Pipe) 1.通信原理 2. 实现方法 共享内存 1.通信原理 2.实现方法 信号量(信号灯集) 1.通信原理 2. 实现方法 3.代码演示 进程间通信(IPC) 必要性 进程间空间独立,资源不共享,此时在需要进程间数据传输时就需要特定的手段进行数据通信 常用进程间通信方法 管道 消息队列 共享内存 型号 信号量 套接字 管道通信(Pipe) 1.通信原理 在内存中开辟管道空间,生成管道操作对象,多个进程使用同一个管道对象进行读写即可实现通信 代码演示(w

  • Linux系统中日志详细介绍

    目录 1.日志相关服务 2.系统中常见的日志文件 1.日志相关服务 在CentOS 6.x中日志服务已经由rsyslogd取代了原先的syslogd服务.RedHat认为syslogd已经不能满足在工作中的需求,rsyslogd服务支持的功能更加丰富. rsyslogd服务相比syslogd服务具有一些新的特点: 基于TCP网络协议传输日志信息. 更安全的网络传输方式. 有日志消息的及时分析框架. 后台数据库.配置文件中可以写简单的逻辑判断. 与syslog配置文件相兼容. 2.系统中常见的日志

  • MySQL中select语句介绍及使用示例

    数据表都已经创建起来了,假设我们已经插入了许多的数据,我们就可以用自己喜欢的方式对数据表里面的信息进行检索和显示了,比如说:可以象下面这样把整个数据表内的内容都显示出来 select * from president; 也可以只选取某一个数据行里的某一个数据列 select birth from president where last_name='Eisenhower'; select语句的通用形式如下: select 你要的信息 from 数据表(一个或多个) where 满足的条件 sel

  • 对MySQL中字符集的相关设置操作的基本教程

    1.查看字符集相关变量 mysql> show variables like 'character%'; +--------–+-----------+ | Variable_name | Value | +--------–+-----------+ | character_set_client | latin1 | | character_set_connection | latin1 | | character_set_database | latin1 | | character_set

  • 如何恢复Mysql数据库的详细介绍

    由于在一台测试机器上打算重新安装Mysql数据库,由于简单粗暴的直接卸载了,没有备份公司Discuz和Redmine使用的Mysql数据库,过程可想的悲惨. 还好的是只是卸载掉了Mysql的程序,所有的数据文件还是存在的. 下面是在恢复数据库的过程 1. Discuz数据库 Discuz数据库的恢复非常顺利, 在安装好新版本的Mysql后,直接将原来的数据库文件copy到新的数据目录中,重新启动mysql, 就能看到恢复的数据库了 2. Redmine数据库 本打算直接使用上面的经验,也能看到所

  • MySQL load语句详细介绍

    load的语法 复制代码 代码如下: LOAD DATA [LOW_PRIORITY | CONCURRENT] [LOCAL] INFILE 'file_name.txt'     [REPLACE | IGNORE]     INTO TABLE tbl_name     [FIELDS         [TERMINATED BY 'string']         [[OPTIONALLY] ENCLOSED BY 'char']         [ESCAPED BY 'char' ]

随机推荐