MySQL 覆盖索引的优点

2025-04-01 08:53:43

一个通常的建议是为WHERE条件创建索引，但这其实是片面的。索引应当为全部查询设计，而不仅仅是WHERE条件。索引确实能有效地查找数据行，但MySQL也能够使用索引获取列数据，这样根本不需要去读取一行数据。毕竟，索引的叶子节点包含了索引对应的值。当年能够读取索引就能够拿到想要的数据时为什么还去读数据行呢？当索引包含了所有查询的数据时，这个索引就称之为覆盖索引。

覆盖索引能够成为一个非常有力的工具并且能够显著改善性能。考虑一下不读数据只需要读取索引的情况：

索引值通常会比整个行存储空间小很多，因此MySQL只读取索引值时可以只读取很少的数据。这对于缓存负荷来说十分重要——响应时间大部分消耗在复制数据。对于磁盘I/O而言也是一样，因为索引数据相比行数据存储空间小很多，因此更节省I/O负载和内存占用（对于MyISAM引擎更显著，因为MyISAM可以将索引打包使得存储空间更小）。
索引是按索引值的顺序存储的，因此I/O访问跨度相比随机磁盘位置获取行数据而言消耗的I/O频次更少。对于某些存储引擎，例如MyISAM和Percona XtraDB，你甚至能够使用OPTIMIZE优化表获得完全有序的索引，这会使得简单范围的查询完全使用顺序访问。
有些存储引擎，例如MyISAM，MySQL内存中只缓存索引。由于操作系统为MyISAM缓存了数据，访问时通常需要一个系统调用。这可能导致巨大的性能影响，尤其是对于缓存负荷场景来说，系统调用对于数据访问来说是最昂贵的代价。
由于InnoDB的聚集索引，覆盖索引对于InnoDB来说十分有帮助。InnoDB的辅助索引在其叶子节点中保存了行的主键值。因此，辅助索引覆盖查询后可以避免进行主键查询。

在所有的场景中，最典型的就是相比查找数据行，只包含索引列的查询的代价相当低。需要注意的是，聚集索引并不是任意类型的索引。聚集索引必须存储索引数据列对应的值。哈希，空间和全文索引并没有存储这些值，因此MySQL只能使用二叉树去覆盖查询。而且，不同的存储引擎实现覆盖索引的方式不同，并且并不是全部的存储引擎都支持覆盖索引（例如Memory存储引擎当前就不支持）。

当你验证查询中索引使用了覆盖索引时，使用Explain语句时，会在Extra列中看到“Using index”。例如，在store_goods表有一个(shop_id, goods_category_id1)的多列索引。MySQL可以在查询返回数据只有这两列时使用索引：

EXPLAIN SELECT `goods_category_id1`,`shop_id` FROM `store_goods` WHERE 1

覆盖索引查询在某些情况会让这样的优化失效。MySQL查询优化器在执行查询时会判断索引是否覆盖到。假设索引覆盖了WHERE条件，但没有覆盖整个查询。如果评估结果决定不走覆盖索引，那么MySQL 5.5及以前的版本会直接获取数据行，即便是不需要这些数据，然后才会过滤掉。

让我们看一下为什么这种情况会发生，然后如何重写查询以便解决这个问题。首先查询是这样的：

EXPLAIN SELECT * FROM products WHERE actor='SEAN CARREY' AND title like '%APOLLO%'

这个时候的结果是不会走覆盖索引，而是普通的索引，这是因为：

没有索引覆盖了查询数据列，因为我们从数据表读取了全部列并且没有索引列覆盖了全部列。理论上，MySQL还有一个快捷方式可以使用，那就是WHERE条件中使用了索引覆盖的列，因此MySQL可以先使用这个索引找到对应的actor，然后在检查他们的title是否匹配，然后在读取满足条件的全部的数据行。
对于早期的低版本的存储引擎API（MySQL 5.5以前的版本）来说，MySQL无法在索引中使用LIKE操作，而只支持简单的比较操作（=，IN，>=）。MySQL可以在索引中使用前缀匹配的LIKE查询，这是因为它可以将它们转换为比较操作。但是前导通配符（也就是LIKE中前置的%）导致存储引擎无法评估匹配条件。因此，MySQL会获取行数据再比较，而不是索引的值。

有一种方式可以使用巧妙的组合索引和重写查询条件。我们可以将索引扩展到(artist, title, prod_id)，然后像下面那样重写查询语句：

EXPLAIN SELECT *
FROM products
	JOIN (
    SELECT prod_id
    FROM products
    WHERE actor='SEAN CARREY' AND TITLE LIKE '%APOLLO%'
 ) AS t1 ON (t1.prod_id=products.prod_id)

我们称之为“递延JOIN(deferred join)”，因为它延迟了列的访问。在第一阶段的查询中，当它在子查询中找到了匹配的行的过程中，MySQL使用了覆盖索引。虽然在整个查询中没有覆盖到，但总比没有的好。

这种优化的效果好坏取决于WHERE条件查找到了多少行数据。假设products表包含了上百万行的数据。可以对比一下这两种查询的性能对比，总的数据为100万行。

第一种情况：有30000个products的actor是“SEAN CARREY”，其中20000个的title包含“APOLLO”；
第二种情况：有30000个products的actor是“SEAN CARREY”，其中40个的title包含“APOLLO”；
第三种情况：有50个products的actor是“SEAN CARREY”，其中10个的title包含“APOLLO”。

对比结果如下表。

数据集	原始查询	优化后查询
第一种情况	5qps	5qps
第二种情况	7qps	35qps
第三种情况	2400qps	2000qps

结果的解释如下：

在第一种情况中，查询返回了很大的结果集，因此看不到优化效果。大部分时间花在了读取和发送数据。
在第二种情况中，使用覆盖索引后子查询过滤得到了一个小的结果集，这样优化的效果是性能提升了5倍。产生这种效果的原因是相比查出30000行的数据集，这里只需要读取40行。
第三种情况显示了子查询失效了。覆盖索引过滤返回的结果集太少了，导致子查询的代价比直接从数据表读取数据还要高。

在大多数存储引擎中，一个索引只能够覆盖访问列是索引的一部分。然而，InnoDB实际上会做进一步的优化。想想InnoDB的的辅助索引在叶子节点中存储了主键的值。这意味着InnoDB的辅助索引实际上有了额外的列帮助InnoDB使用覆盖索引。例如，sakila.actor表使用了InnoDB，然后在last_name有一个索引，因此这个索引能够覆盖或者主键actor_id的查询——即便这个列并不是索引的一部分。

EXPLAIN SELECT actor_id, last_name
FROM sakila.actor WHERE last_name = 'HOPPER'

以上就是MySQL 覆盖索引的优点的详细内容，更多关于MySQL 覆盖索引的资料请关注我们其它相关文章！

MySQL覆盖索引的使用示例

什么是覆盖索引创建一个索引,该索引包含查询中用到的所有字段,称为"覆盖索引". 使用覆盖索引,MySQL 只需要通过索引就可以查找和返回查询所需要的数据,而不必在使用索引处理数据之后再进行回表操作. 覆盖索引可以一次性完成查询工作,有效减少IO,提高查询效率. 使用示例查询语句: SELECT col2, col3 FROM test_table WHERE col1 = xxx ORDER BY col2; 创建一个单列索引: ALTER TABLE `test_table` A
Mysql性能优化案例研究-覆盖索引和SQL_NO_CACHE

场景产品中有一张图片表pics,数据量将近100万条,有一条相关的查询语句,由于执行频次较高,想针对此语句进行优化表结构很简单,主要字段: 复制代码代码如下: user_id 用户ID picname 图片名称 smallimg 小图名称一个用户会有多条图片记录,现在有一个根据user_id建立的索引:uid,查询语句也很简单:取得某用户的图片集合: 复制代码代码如下: select picname, smallimg from pics where user_id = xxx; 优化
Mysql覆盖索引详解

概念如果索引包含所有满足查询需要的数据的索引成为覆盖索引(Covering Index),也就是平时所说的不需要回表操作判断标准使用explain,可以通过输出的extra列来判断,对于一个索引覆盖查询,显示为using index,MySQL查询优化器在执行查询前会决定是否有索引覆盖查询注意 1.覆盖索引也并不适用于任意的索引类型,索引必须存储列的值 2.Hash 和full-text索引不存储值,因此MySQL只能使用B-TREE 3.并且不同的存储引擎实现覆盖索引都是不同的 4.并
MySQL 的覆盖索引与回表的使用方法

两大类索引使用的存储引擎:MySQL5.7 InnoDB 聚簇索引 * 如果表设置了主键,则主键就是聚簇索引 * 如果表没有主键,则会默认第一个NOT NULL,且唯一(UNIQUE)的列作为聚簇索引 * 以上都没有,则会默认创建一个隐藏的row_id作为聚簇索引 InnoDB的聚簇索引的叶子节点存储的是行记录(其实是页结构,一个页包含多行数据),InnoDB必须要有至少一个聚簇索引. 由此可见,使用聚簇索引查询会很快,因为可以直接定位到行记录. 普通索引普通索引也叫二级索引,除聚簇索引外的
mysql中关于覆盖索引的知识点总结

如果一个索引包含(或覆盖)所有需要查询的字段的值,称为'覆盖索引'. 覆盖索引是一种非常强大的工具,能大大提高查询性能,只需要读取索引而不需要读取数据,有以下优点: 1.索引项通常比记录要小,所以MySQL访问更少的数据. 2.索引都按值得大小存储,相对于随机访问记录,需要更少的I/O. 3.数据引擎能更好的缓存索引,比如MyISAM只缓存索引. 4.覆盖索引对InnoDB尤其有用,因为InnoDB使用聚集索引组织数据,如果二级索引包含查询所需的数据,就不再需要在聚集索引中查找了. 限制: 1.
mysql利用覆盖索引避免回表优化查询

前言说到覆盖索引之前,先要了解它的数据结构:B+树. 先建个表演示(为了简单,id按顺序建): id name 1 aa 3 kl 5 op 8 aa 10 kk 11 kl 14 jk 16 ml 17 mn 18 kl 19 kl 22 hj 24 io 25 vg 29 jk 31 jk 33 rt 34 ty 35 yu 37 rt 39 rt 41 ty 45 qt 47 ty 53 qi 57 gh 61 dh 以主键以外的列值作为键值构建的 B+ 树索引,我们称之为非聚集索引.
Mysql性能优化案例 - 覆盖索引分享

场景产品中有一张图片表,数据量将近100万条,有一条相关的查询语句,由于执行频次较高,想针对此语句进行优化表结构很简单,主要字段: 复制代码代码如下: user_id 用户ID picname 图片名称 smallimg 小图名称一个用户会有多条图片记录现在有一个根据user_id建立的索引:uid 查询语句也很简单:取得某用户的图片集合复制代码代码如下: select picname, smallimg from pics where user_id = xxx; 优化前执行查
MySQL 覆盖索引的优点

一个通常的建议是为WHERE条件创建索引,但这其实是片面的.索引应当为全部查询设计,而不仅仅是WHERE条件.索引确实能有效地查找数据行,但MySQL也能够使用索引获取列数据,这样根本不需要去读取一行数据.毕竟,索引的叶子节点包含了索引对应的值.当年能够读取索引就能够拿到想要的数据时为什么还去读数据行呢?当索引包含了所有查询的数据时,这个索引就称之为覆盖索引. 覆盖索引能够成为一个非常有力的工具并且能够显著改善性能.考虑一下不读数据只需要读取索引的情况: 索引值通常会比整个行存储空间小很多,因此
mysql聚集索引、辅助索引、覆盖索引、联合索引的使用

目录聚集索引(Clustered Index) 辅助索引(Secondary Index) 覆盖索引(Covering index) 联合索引 <MySQL技术内幕 InnoDB存储引擎>学习笔记聚集索引(Clustered Index) 聚集索引就是按照每张表的主键构造一棵B+树,同时叶子节点中存放的即为整张表的行记录数据. 举个例子,直观感受下聚集索引. 创建表t,并以人为的方式让每个页只能存放两个行记录(不清楚怎么人为控制每页只存放两个行记录): 最后<MySQL技术内幕>
MySQL 回表,覆盖索引,索引下推

目录回表覆盖索引索引下推无索引下推: 查看索引下推的状态有索引下推: 开启索引下推回表在研究mysql二级索引的时候,发现Mysql回表这个操作,往下研究了一下字面意思,找到索引,回到表中找数据解释一下就是: 先通过索引扫描出数据所在的行,再通过行主键ID 取出数据. 举个例子说明: SELECT * FROM INNODB_USER WHERE AGE = 18 AND USER_NAME LIKE '模糊查%'; 假如age和user_name两个字段是个联合索引,我们通过

MySQL 覆盖索引的优点

相关推荐

随机推荐