MySQL查询优化必备知识点总结

前言

查询优化本就不是一蹴而就的,需要学会使用对应的工具、借鉴别人的经验来对SQL进行优化,并且提升自己。

先来巩固一下索引的优点,检索数据快、查询稳定、存储具有顺序性避免服务器建立临时表、将随机的I/O变为有序的I/O。

但索引一旦创建的不规范就会造成以下问题,占用额外空间,浪费内存,降低数据的增、删、改性能。

所以只有在理解索引数据结构的基础上才能创建出高效的索引。

**本文所有操作均在MySQL8.0.12**

一、创建索引规范

在学习索引优化之前,需要对创建索引的规范有一定的了解,此规范来自于阿里巴巴开发手册。

主键索引:pk_column_column

唯一索引:uk_column_column

普通索引:idx_column_column

二、索引失效原因

创建索引需知道在什么情况下索引会失效,只有了解索引失效的原因,在创建索引时才不会出现一些已知错误。

1.带头大哥不能死

这局经典的语句就是涵盖创建索引时一定要符合最左侧原则。

例如表结构为 u_id,u_name,u_age,u_sex,u_phone,u_time

创建索引为 idx_user_name_age_sex

查询条件必须带上u_name这一列。

2.不在索引列上做任何操作

不在索引列上做任何计算、函数、自动或者手动的类型转换,否则会进行全表扫描。简而言之不要在索引列上做任何操作。

3.俩边类型不等

例如建立了索引idx_user_name,name字段类型为varchar

在查询时使用where name = kaka,这样的查询方式会直接造成索引失效。

正确的用法为where name = "kaka"

4.不适当的like查询会导致索引失效

创建索引为idx_user_name

执行语句为select * from user where name like "kaka%";可以命中索引。

执行语句为select name from user where name like "%kaka";可以使用到索引(仅在8.0以上版本)。

执行语句为select * from user where name like ''%kaka";会直接导致索引失效

5.范围条件之后的索引会失效

创建索引为idx_user_name_age_sex

执行语句select * from user where name = 'kaka' and age > 11 and sex = 1;

上面这条sql语句只会命中name和age索引,sex索引会失效。

复合索引失效需要查看key_len的长度即可。

总结:%在后边会命令索引,当使用了覆盖索引时任何查询方式都可命中索引。

以上就是咔咔关于索引失效会出现的原因总结,在很多文章中没有标注MySQL版本,所以你有可能会看到is null 、or索引会失效的结论。

三、SQL优化杀手锏之 Explain

在写完SQL语句之后必须要做的一件事情就是使用Explain进行SQL语句检测,看是否命中索引。

下图就是使用explain输出格式,接下来将会对输出格式进行简单的解释。

1.id 这列就是查询的编号,如果查询语句中没有子查询或者联合查询这个标识就一直是1。

如存在子查询或者联合查询这个编号会自增。

2.select_type

最常见的类型就是SIMPLE和PRIMARY,此列知道就行了。

3.table

理解为表名即可

4. **type

此列是在优化SQL语句时最需要关注的列之一,此列显示了查询使用了何种类型。

以下排序从最优到最差。

  • system:表内只有一行数据
  • const:最多只会有一条记录匹配,常用于主键或者唯一索引为条件查询
  • eq_ref:当连接使用的索引为主键和唯一时会出现
  • ref:使用普通索引=或<=> 运算符进行比较将会出现
  • fulltext:使用全文索引
  • ref_or_null:跟ref类型类似,只是增加了null值的判断,实际用的不多。语句为where name = 'kaka' and name is null,name为普通索引。
  • index_merge:查询语句使用了俩个以上的索引,常见在使用and、or会出现,官方文档将此类型放在ref_or_null之后,但是在很多的情况下由于读取索引过多性能有可能还不如range
  • unique_subquery:用于where中的in查询,完全替换子查询,效率更高。语句为value IN (SELECT primary_key FROM single_table WHERE some_expr)
  • index_subquery:子查询中的返回结果字段组合是一个索引(或索引组合),但不是一个主键或唯一索引
  • range:索引范围查询,常见于使用 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN()或者like等运算符的查询中。
  • index:索引全表扫描,把索引从头到尾扫一遍
  • all:全表扫描,性能最差。

5.possible_keys

此列显示的可能会使用到的索引

6. **key

优化器从possible_keys中命中的索引

7.key_len

查询用到的索引长度(字节数),key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。

8.ref

如果是使用的常数等值查询,这里会显示const。

如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段。

如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为func。

9. **rows

这是mysql估算的需要扫描的行数(不是精确值)。

这个值非常直观显示 SQL 的效率好坏, 原则上 rows 越少越好。

10.filtered

此列表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数

11. **extra

在大多数情况下会出现以下几种情况。

  • Using index:使用了覆盖索引,查询列都为索引字段
  • Using where:使用了where语句
  • Using temporary :查询结果进行排序的时候使用了一张临时表
  • Using filesort :对数据使用一个外部的索引排序
  • Using index condition:使用了索引下推,关于索引下推可以查看咔咔之前文章MySQL索引一文

12.总结

以上就是关于Explain所有列的说明,在平时开发的过程中,一般只会关注type、key、rows、extra这四列。

  • type优化目标至少达到range级别,要求是ref级别,如果可以consts最好。
  • key是查询使用到的索引,如果此列为空,要么未建立索引,要么索引失效。
  • rows是这条SQL语句扫描的行数,越少越好。
  • extra:此列为扩展列,如果出现临时表、文件排序则需要优化。

四、SQL优化杀手锏之 慢查询

上文说到了可以直接使用explain来分析自己的SQL语句是否合理,接下来再聊一个点那就是慢查询。

查看慢查询是否打开

查看是否记录没有使用索引的SQL语句

开启慢查询、开启记录没有使用到索引的SQL语句

set global log_queries_not_using_idnexes='on';

set global log_queries_not_using_indexes='on';

查询以上俩个配置是否打开

设置慢查询时间,这个时间由自己把控,一般1s即可 set globle long_query_time=1;

如果查看这个时间没有变,则关于客户端在重新连接一次即可。

查看慢查询存储位置

然后随便执行一条不执行索引的语句即可在这个日志中查看到此语句

上图中一般需要主要观察的是Query_time、SQL语句内容。

以上就是关于如何使用慢查询来查看项目中出现问题的SQL语句。

五、优化大法

此处跟大家聊一些常用的SQL语句优化方案,以上的俩个工具要好好的利用,辅助我们进行打怪。

  • 禁止使用select *,需要什么字段查询什么字段
  • where字段设置索引
  • group by、order by字段设置索引
  • 舍弃offset,limit分页,使用延迟关联来实现分页(数据量不大时可不用)
  • 写分页时当count为0时,直接返回避免执行分页语句
  • 利用覆盖索引进行查询避免回表
  • 建立复合索引时区分度最高的放在最左侧
  • 统计数据行数只用count(*),别整的花里胡哨的
  • 关于in和exist,如果查询的俩个表大小一致则性能差别可忽略,如果子查询表大用exist,否则使用in
  • 查询一行数据时加上limit 1
  • 选择合理的数据类型,在满足条件下数据类型越小越好
  • 联合查询join最多三个表,并且需要join的字段数据类型保持一致
  • in操作能避免尽量避免,无法避免的情况下in元素控制在1000以内
  • 数据更新频繁,区分度不高的列不适合建立索引
  • explain中的type至少要达到range,要求为ref
  • 联合索引满足最左侧原则

六、总结

到此这篇关于MySQL查询优化必备知识点的文章就介绍到这了,更多相关MySQL查询优化内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 大幅优化MySQL查询性能的奇技淫巧

    回顾 MySQL / InnoDB 的改善历史.你能很容易发现.在MySQL 5.6稳定版本中从来没有在read-only 这么快的提速,它很容易搞懂,以及在read-only(RO)有着良好的扩张性.也很期待它在read+write(RW)上达到一个较高水平.(特别是在读取数据是数据库主要工作的时候) 然而.我们对于RO在 MySQL 5.6的表现也十分的高兴,在5.7这个版本中,主要工作集中在 read+write (RW)上, 因为在大数据的处理上还没能达到我们的期望.但是RW依赖RO下.

  • MySQL查询优化之explain的深入解析

    在分析查询性能时,考虑EXPLAIN关键字同样很管用.EXPLAIN关键字一般放在SELECT查询语句的前面,用于描述MySQL如何执行查询操作.以及MySQL成功返回结果集需要执行的行数.explain 可以帮助我们分析 select 语句,让我们知道查询效率低下的原因,从而改进我们查询,让查询优化器能够更好的工作. 一.MySQL 查询优化器是如何工作的MySQL 查询优化器有几个目标,但是其中最主要的目标是尽可能地使用索引,并且使用最严格的索引来消除尽可能多的数据行.最终目标是提交 SEL

  • 浅谈MySQL中优化sql语句查询常用的30种方法

    1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描. 3.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id from

  • Mysql查询最近一条记录的sql语句(优化篇)

    下策--查询出结果后将时间排序后取第一条 select * from a where create_time<="2017-03-29 19:30:36" order by create_time desc limit 1 这样做虽然可以取出当前时间最近的一条记录,但是一次查询需要将表遍历一遍,对于百万以上数据查询将比较费时:limit是先取出全部结果,然后取第一条,相当于查询中占用了不必要的时间和空间:还有如果需要批量取出最近一条记录,比方说:"一个订单表,有用户,订

  • 详解Mysql多表联合查询效率分析及优化

    1. 多表连接类型 1. 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用','  如: SELECT * FROM table1 CROSS JOIN table2 SELECT * FROM table1 JOIN table2 SELECT * FROM table1,table2 由于其返回的结果为被连接的两个数据表的乘积,因此当有WHERE, ON或USING条件的时候一般不建议使用,因为当数据表项目太多的时候,会非常慢.一般使用LE

  • mysql in语句子查询效率慢的优化技巧示例

    表结构如下,文章只有690篇. 文章表article(id,title,content) 标签表tag(tid,tag_name) 标签文章中间表article_tag(id,tag_id,article_id) 其中有个标签的tid是135,查询标签tid是135的文章列表. 690篇文章,用以下的语句查询,奇慢: select id,title from article where id in( select article_id from article_tag where tag_id=

  • mysql优化limit查询语句的5个方法

    mysql的分页比较简单,只需要limit offset,length就可以获取数据了,但是当offset和length比较大的时候,mysql明显性能下降 1.子查询优化法 先找出第一条数据,然后大于等于这条数据的id就是要获取的数据 缺点:数据必须是连续的,可以说不能有where条件,where条件会筛选数据,导致数据失去连续性,具体方法请看下面的查询实例: 复制代码 代码如下: mysql> set profiling=1; Query OK, 0 rows affected (0.00

  • Mysql使用索引实现查询优化

    索引的目的在于提高查询效率,可以类比字典,如果要查"mysql"这个单词,我们肯定需要定位到m字母,然后从下往下找到y字母,再找到剩下的sql.如果没有索引,那么你可能需要把所有单词看一遍才能找到你想要的. 1.索引的优点 假设你拥有三个未索引的表t1.t2和t3,每个表都分别包含数据列i1.i2和i3,并且每个表都包含了1000条数据行,其序号从1到1000.查找某些值匹配的数据行组合的查询可能如下所示: SELECT t1.i1, t2.i2, t3.i3 FROM t1, t2,

  • 提升MYSQL查询效率的10个SQL语句优化技巧

    MySQL数据库执行效率对程序的执行速度有很大的影响,有效的处理优化数据库是非常有用的.尤其是大量数据需要处理的时候. 1. 优化你的MySQL查询缓存 在MySQL服务器上进行查询,可以启用高速查询缓存.让数据库引擎在后台悄悄的处理是提高性能的最有效方法之一.当同一个查询被执行多次时,如果结果是从缓存中提取,那是相当快的. 但主要的问题是,它是那么容易被隐藏起来以至于我们大多数程序员会忽略它.在有些处理任务中,我们实际上是可以阻止查询缓存工作的. // query cache does NOT

  • mysql嵌套查询和联表查询优化方法

    嵌套查询糟糕的优化在上面我提到过,不考虑特殊的情况,联表查询要比嵌套查询更有效.尽管两条查询表达的是同样的意思,尽管你的计划是告诉服务器要做什么,然后让它决定怎么做,但有时候你非得告诉它改怎么做.否则优化器可能会做傻事.我最近就碰到这样的情况.这几个表是三层分级关系:category, subcategory和item.有几千条记录在category表,几百条记录在subcategory表,以及几百万条在item表.你可以忽略category表了,我只是交代一下背景,以下查询语句都不涉及到它.这

随机推荐