原来MySQL 数据类型也可以优化

目录
  • 不超过范围的情况下,数据类型越小越好
  • 简单就好
  • 尽量避免 null
  • 一些细则
    • 整数类型
    • 字符和字符串类型
      • varchar :根据实际内容长度保存数据。
      • char:固定长度的字符串
    • BLOB 和 TEXT 类型
    • 日期时间
      • datetime
      • timestamp
      • date
    • 使用枚举代替字符串类型
    • 特殊类型数据

不超过范围的情况下,数据类型越小越好

应该尽量使用可以正确存储数据的最小数据类型,更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处理时需要的CPU周期更少。

但是要确保选择的存储类型范围足够用,如果无法确认哪个数据类型,就选择你认为不会超过范围的最小类型。

看一个案例,下面是两张字段相同,字段类型相同,只是 id 字段 emp1 是 smallint 类型, emp2 的 id 是 bigint 类型,分别向两个表插入 5000 条记录,观察一下表容量大小。

CREATE TABLE `mytest`.`emp1`  (  `id` smallint(5) NULL,  `name` varchar(255) NULL);
CREATE TABLE `mytest`.`emp2`  (  `id` bigint(5) NULL,  `name` varchar(255) NULL);

两个表的初始大小是一致的,都是 96K :

PS:可以用如下命令查看数据文件的存放位置:

> mysql> show variables like '%datadir%';
+---------------+-----------------+
| Variable_name | Value           |
+---------------+-----------------+
| datadir       | /var/lib/mysql/ |
+---------------+-----------------+
1 row in set (0.01 sec)

为了方便,写个 shell 脚本分别向两个表插入 5000 条记录:

#!/bin/bash
i=1
while [ $i -le 5000 ]
do
    mysql -uroot -p123456 mytest -e "insert into emp2 (id,name) values ($i,'n$i');"
    i=$(($i+1))
done

注意表名,emp1 和 emp2 分别执行一遍。

执行完毕,确认两个表都是 5000 条记录:

mysql> select count(*) from emp1;
+----------+
| count(*) |
+----------+
|    5000 |
+----------+
1 row in set (0.03 sec)

mysql> select count(*) from emp2;
+----------+
| count(*) |
+----------+
|    5000 |
+----------+
1 row in set (0.01 sec)

来,见证一下奇迹先:

[root@node1 mytest]# ll -h | grep emp1.ibd && ll -h | grep emp2.ibd
-rw-r-----. 1 mysql mysql 272K 8月   9 09:33 emp1.ibd
-rw-r-----. 1 mysql mysql 304K 8月   9 09:37 emp2.ibd

可以发现,两个表占用的空间竟然不一样,表 emp1 id字段类型 smallint(5) 插入 5000 条记录后占用空间为 272K ,而 emp2 id字段类型 bigint(5) 插入同样的数据后占用空间大小为 304K 。

这就是所谓 不超过范围的情况下,数据类型越小越好 。

简单就好

简单数据类型的操作通常需要更少的CPU周期

  • 1、整型比字符操作代价更低,因为字符集和校对规则是字符比较比整型比较更复杂;
  • 2、使用 MySQL 自建类型而不是字符串来存储日期和时间;
  • 3、用整型存储IP地址。

我们拿日期数据类型来举个例子,同样建两张表:

CREATE TABLE `tab1` (
  `id` smallint(5) NULL,
  `name` varchar(255) NULL,
  `ctime` date NULL
);

CREATE TABLE `tab2` (
  `id` smallint(5) NULL,
  `name` varchar(255) NULL,
  `ctime` datetime NULL
);

tab1 的 ctime 字段类型为 date ,tab2 的 ctime 字段类型为 datetime ,同样,执行 shell 脚本,插入 20000 条记录:

#!/bin/bash
i=1
while [ $i -le 20000 ]
do
    mysql -uroot -p123456 test -e "insert into tab1 (id,name,ctime) values ($i,'n$i',now());"
    i=$(($i+1))
done

改下脚本,再向表 tab2 插入 20000 条记录。

数据准备完毕后,我们来分别查询一下这两个表:

look,看到了,查询两个表的 SQL 语句执行速度不一样(样本量可能还有点小)!

尽量避免 null

如果查询中包含可为 NULL 的列,对 MySQL 来说很难优化,因为可为 null 的列使得 索引 、 索引统计 和 值比较 都更加复杂。

通常情况下 null 的列改为 not null 带来的性能提升比较小,所有没有必要将所有的表的 schema 进行修改,但是应该尽量避免设计成可为 null 的列。

一切以实际情况为准 。

一些细则

整数类型

可以使用的几种整数类型:

  • TINYINT 8 bit,
  • SMALLINT 16 bit,
  • MEDIUMINT 24 bit,
  • INT 32 bit,
  • BIGINT 64 bit

尽量使用满足需求的最小数据类型。前文有述。

字符和字符串类型

varchar :根据实际内容长度保存数据。

使用最小的符合需求的长度:

varchar(n) :n小于等于255使用额外一个字节保存长度,n>255使用额外两个字节保存长度。

varchar(5) 与 varchar(255) 保存同样的内容,硬盘存储空间相同,但内存空间占用不同,是指定的大小 。

varchar在 MySQL 5.6 之前变更长度,或者从255一下变更到255以上时,都会导致 锁表 。

varchar应用场景:

存储长度波动较大的数据,如:文章,有的会很短有的会很长;

字符串很少更新的场景,每次更新后都会重算并使用额外存储空间保存长度;

适合保存多字节字符,如:汉字,特殊字符等。

char:固定长度的字符串

最大长度:255;

会自动删除末尾的空格;

检索效率、写效率 会比varchar高,以空间换时间。

char 使用场景:

存储长度波动不大的数据,如:md5摘要;

存储短字符串、经常更新的字符串。

BLOB 和 TEXT 类型

MySQL 把每个 BLOB 和 TEXT值当作一个独立的对象处理。

两者都是为了存储很大数据而设计的字符串类型,分别采用二进制和字符方式存储。

日期时间

datetime

  • 占用8个字节;
  • 与时区无关,数据库底层时区配置,对 datetime 无效;
  • 可保存到毫秒;
  • 可保存时间范围大;
  • 不要使用字符串存储日期类型,占用空间大,损失日期类型函数的便捷性。

timestamp

  • 占用4个字节;
  • 时间范围:1970-01-01到2038-01-19;
  • 精确到秒;
  • 采用整形存储;
  • 依赖数据库设置的时区;
  • 自动更新timestamp列的值。

date

  • 占用的字节数比使用字符串、datetime、int存储要少,使用date类型只需要3个字节;
  • 使用date类型还可以利用日期时间函数进行日期之间的计算;
  • date类型用于保存1000-01-01到9999-12-31之间的日期。

使用枚举代替字符串类型

有时可以使用 枚举 类型代替常用的字符串类型,MySQL 存储枚举类型会非常紧凑,会根据列表值的数据压缩到一个或两个字节中,MySQL 在内部会将每个值在列表中的位置保存为整数,并且在表的 .frm 文件中保存“数字-字符串”映射关系的查找表。

特殊类型数据

曾经我使用 varchar(15) 来存储 ip 地址,然而,ip 地址的本质是 32 位无符号整数不是字符串,可以使用 INET_ATON 和 INET_NTOA 函数在这两种表示方法之间转换。

比如:

mysql> select inet_aton('192.168.134.119');
+------------------------------+
| inet_aton('192.168.134.119') |
+------------------------------+
|                   3232269943 |
+------------------------------+
1 row in set (0.03 sec)

mysql> select inet_ntoa('3232269943');
+-------------------------+
| inet_ntoa('3232269943') |
+-------------------------+
| 192.168.134.119         |
+-------------------------+
1 row in set (0.03 sec)

到此这篇关于原来MySQL 数据类型也可以优化的文章就介绍到这了,更多相关MySQL 数据类型 内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • MySQL8.0.23版本的root密码重置最优解法

    该方法编辑于2021年2月7日,自己使用的版本是8.0.23,事情的起因要从袁隆平教授说起-要从一本教科书说起,有一章节是"MySQL安全管理与权限管理",其中有提到更改root账户 ps:此方法适用于任何忘记,胡乱修改或已经糟蹋root密码的同学 本着实践主义的精神,我在自己的MySQL数据库中(当前登陆为root账户)中敲下了: update user set authentication_string=MD5("123") where user = "

  • MySQL 5.6 & 5.7最优配置文件模板(my.ini)

    Inside君整理了一份最新基于MySQL 5.6和5.7的配置文件模板,基本上可以说覆盖90%的调优选项,用户只需根据自己的服务器配置稍作修改即可,如InnoDB缓冲池的大小.IO能力(innodb_buffer_pool_size,innodb_io_capacity).特别注意,这份配置文件不用修改,可以直接运行在MySQL 5.6和5.7的版本下,这里使用了小小的技巧,具体可看配置文件.如果配置参数存在问题,也可以及时反馈Inside君,我们一起成长. 触发Inside君做这件事情的原因

  • MySQL数据类型enum 枚举类型

    例如: 性别 gender 男 女 保密 基本语法: enum(数据值 1,数据值 2...); 数据值列表在 255 个以内,使用 1 个字节来存储 数据值列表超过 255,但是小于 65535,使用 2 个字节来存储 -- Enum(0=>'男', 1=>'女', 2=>'保密') create table my_enum( gender enum('男', '女', '保密') ) mysql> desc my_enum; +--------+----------------

  • MySQL 数据类型及最优选取规则

    目录 数据类型 整型 浮点型 定点数 字符型 日期时间型 字段类型的选取原则 数据类型 日常开发中,最常使用到的 MySQL 中常用的数据类型有 : 整型, 浮点型, 定点数, 字符型, 时间日期类型. 下面对其分别进行总结. 整型 格式为 : INT[(M)] [UNSIGNED] [ZEROFILL] 取值范围:如果是 unsigned 无符号位 , 则最大值翻倍, 如 tinyint unsigned 的取值范围为 (0~256). 注意:INT(1) 和 INT(10) 没有区别, 占用

  • 如何创建一个创建MySQL数据库中的datetime类型

    目录 一.domain用法及示例 二.创建MySQL中datetime类型 三.create type用法及示例 环境系统平台:Microsoft Windows (64-bit) 10版本:4.5 瀚高数据库中支持使用以下语句创建用户定义的数据类型: ​CREATE DOMAIN​:它创建了一个用户定义的数据类型,可以有可选的约束,基于其他基本类型,实质是定义一个域. ​CREATE TYPE​:它通常用于使用存储过程创建复合类型(两种或多种数据类型混合的数据类型). 一.domain用法及示

  • MySQL对JSON类型字段数据进行提取和查询的实现

    目录 前言 1. 问题现象 2. 解决方案 3. JSON数据查询 3.1 一般基础查询操作 3.2 一般函数查询操作 4. JSON数据新增更新删除 前言 昨天上线后通过系统报警发现了一个bug,于是紧急进行了回滚操作,但是期间有用户下单,数据产生了影响,因此需要排查影响了哪些订单,并对数据进行修复. 1. 问题现象 由于bug导致了订单表的customer_extra_info字段的hasFreightInsurance误更新成了“是”,因此需要查询回滚前一共有多少被误更新为“是”的订单,如

  • MySQL中JSON字段数据类型详解

    目录 前言 创建JSON值 搜索JSON类型数据 在 JSON 和非 JSON 值之间转换 JSON 值的汇总 总结 前言 JSON 类型是从 MySQL 5.7 版本开始支持的功能,MySQL 支持由RFC 7159定义的本机JSON数据类型,该类型可有效访问 JSON(JavaScript 对象 table 示法)文档中的数据.与将 JSON 格式的字符串存储在字符串列中相比,JSON数据类型具有以下优点: 自动验证存储在JSON列中的 JSON 文档.无效的文档会产生错误. 优化的存储格式

  • 详解PyMySQL插入字典类型的数据

    在我们爬虫或者调API获取数据后,需要将数据存入到数据库中,如果数据是列表嵌套字典格式的话,一般做法是遍历列表,然后用字典生成对应的SQL语句再执行插入到表中.本文将介绍一种更加简便的方法来插入字典类型的数据. 我们有如下数据列表,需要将该数据插入到对应的数据表student中(表的字段名和数据列表中字典的键名相同) student_list = [ {"name": "Tony", "age": 19, "sex": &qu

  • 深入理解MySQL数据类型的选择优化

    目录 前言 1 整数类型 2 实数类型 3 字符串类型 3.1 VARCHAR和CHAR类型 3.1.1 最大长度 3.2 Binary和VarBinary类型 3.3 BLOB和TEXT类型 3.3 ENUM类型 4 日期和时间类型 5 位数据类型 6 选择优化的数据类型 6.1 特殊的数据类型 前言 介绍了MySQL的常用数据类型的基本特性,以及数据类型的选择优化. MySQL数据类型是定义列中可以存储什么数据以及该数据实际怎样存储的基本规则,正确的选择数据库字段的字段类型对于数据库性能有很

  • 原来MySQL 数据类型也可以优化

    目录 不超过范围的情况下,数据类型越小越好 简单就好 尽量避免 null 一些细则 整数类型 字符和字符串类型 varchar :根据实际内容长度保存数据. char:固定长度的字符串 BLOB 和 TEXT 类型 日期时间 datetime timestamp date 使用枚举代替字符串类型 特殊类型数据 不超过范围的情况下,数据类型越小越好 应该尽量使用可以正确存储数据的最小数据类型,更小的数据类型通常更快,因为它们占用更少的磁盘.内存和CPU缓存,并且处理时需要的CPU周期更少. 但是要

  • MySQL数据类型优化原则

    MySQL支持的数据类型很多,选择正确的数据类型对于高性能至关重要.下面几个简单的原则都有助于做出更好的选择. 更小的通常更好 应该尽量使用可以正确储存数据的最小数据类型.更小的数据类型通常更快,因为它们占用更少的磁盘.内存和CPU缓存,并且处理时需要的CPU周期也更少.如果无法确定哪个数据类型时最好的,就选择你认为不会超过范围的最小类型. 简单就好 简单数据类型的操作通常需要更少的CPU周期.例如,整形比字符操作代价更低,因为字符集和校对规则(排序规则)使字符比较比整形更复杂.比如用MySQ内

  • 101个MySQL的配置和优化的提示

    MySQL是一个功能强大的开源数据库.随着越来越多的数据库驱动的应用程序,人们一直在推动MySQL发展到它的极限.这里是101条调节和优化 MySQL安装的技巧.一些技巧是针对特定的安装环境的,但这些思路是通用的.我已经把他们分成几类,来帮助你掌握更多MySQL的调节和优化技巧. MySQL 服务器硬件和操作系统调节: 1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中--在内存中访问文件时的速度要比在硬盘中访问时快的多.2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读

  • MYSQL数据库表结构优化方法详解

    本文实例讲述了MYSQL数据库表结构优化方法.分享给大家供大家参考,具体如下: 选择合适的数据类型 1.使用可以存下你的数据的最小的数据类型 2.使用简单的数据类型.Int要比varchar类型在mysql处理上简单 3.尽可能的使用not null定义字段 4.尽量少用text类型,非用不可时最好考虑分表 使用int来存储日期时间,利用FROM_UNIXTIME()[将int类型时间戳转换成日期时间格式],UNIX_TIMESTAMP()[将日期时间格式转换成int类型]两个函数进行转换 使用

  • 三种常用的MySQL 数据类型

    MySQL中定义数据字段的类型对你数据库的优化是非常重要的. MySQL支持多种类型,大致可以分为三类:数值.日期/时间和字符串(字符)类型. 数值类型 MySQL支持所有标准SQL数值数据类型. 这些类型包括严格数值数据类型(INTEGER.SMALLINT.DECIMAL和NUMERIC),以及近似数值数据类型(FLOAT.REAL和DOUBLE PRECISION). 关键字INT是INTEGER的同义词,关键字DEC是DECIMAL的同义词. BIT数据类型保存位字段值,并且支持MyIS

  • MySQL 数据类型选择原则

    小而美 通常来说,尽可能使用占用存储空间小的数据类型来存储数据.这类数据类型通常也会更快,并且占用的磁盘空间.内存乃至缓存都更小,而且占用的 CPU 处理周期也少. 但是,务必准确估计要存储的数据值的范围.因为在数据表结构的多个地方扩充数据范围会是一个痛苦且耗时的过程.如果在犹豫哪种数据类型合适,那就选择你认为不会超出范围的最小空间的类型(在系统早期或者数据表 数据不多的情况下也可以进行调整). 简单至上 数据类型越简单意味着处理数据的 CPU 周期越少.例如,整型相比字符型而言,处理起来更容易

  • 详解MySQL数据类型DECIMAL(N,M)中N和M分别表示的含义

    同事问MySQL数据类型DECIMAL(N,M)中N和M分别表示什么含义,M不用说,显然是小数点后的小数位数,但这个N究竟是小数点之前的最大位数,还是加上小数部分后的最大位数?这个还真记不清了.于是乎,创建测试表验证了一番,结果如下: 测试表,seller_cost字段定义为decimal(14,2) CREATE TABLE `test_decimal` ( `id` int(11) NOT NULL, `seller_cost` decimal(14,2) DEFAULT NULL ) EN

  • MySQL数据类型中DECIMAL的用法实例详解

    MySQL数据类型中DECIMAL的用法实例详解 在MySQL数据类型中,例如INT,FLOAT,DOUBLE,CHAR,DECIMAL等,它们都有各自的作用,下面我们就主要来介绍一下MySQL数据类型中的DECIMAL类型的作用和用法. 一般赋予浮点列的值被四舍五入到这个列所指定的十进制数.如果在一个FLOAT(8, 1)的列中存储1. 2 3 4 5 6,则结果为1. 2.如果将相同的值存入FLOAT(8, 4) 的列中,则结果为1. 2 3 4 6. 这表示应该定义具有足够位数的浮点列以便

  • Mysql数据库之索引优化

    MySQL凭借着出色的性能.低廉的成本.丰富的资源,已经成为绝大多数互联网公司的首选关系型数据库.虽然性能出色,但所谓"好马配好鞍",如何能够更好的使用它,已经成为开发工程师的必修课,我们经常会从职位描述上看到诸如"精通MySQL"."SQL语句优化"."了解数据库原理"等要求.我们知道一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,

随机推荐