详解MySQL 联合查询优化机制

2025-03-03 03:01:31

MySQL 联合查询执行策略。

以一个 UNION 查询为例，MySQL 执行 UNION 查询时，会把他们当做一系列的单个查询语句，然后把对应的结果放入到临时表中，最终再读出来返回。在 MySQL中，每个独立的查询都是一个联合查询，从临时表读取返回结果也一样。

这种情形下，MySQL 的联合查询执行很简单——它将这里的联合查询当做是嵌套循环的联合查询。这意味着 MySQL 会运行一个循环去从数据表读取数据行，然而在运行一个嵌套循环从下一个表读取匹配的数据行。这个过程一直持续，直到找到联合查询中的所有匹配的数据行。然后再根据 SELECT 语句中需要的列去构建返回结果。如下面的查询语句所示：

SELECT tb1.col1, tb2.col2
FROM tb1 INNER JOIN tb2 USING(col3)
WHERE tb1.col1 IN(5,6);

实际转换为 MySQL可能执行的伪代码是下面这样的：

outer_iter = iterator over tb1 where col1 IN(5,6);
outer_row = outer_iter.next;
while outer_row
	inner_iter = iterator over tb2 where col3 = outer_row.col3;
	inner_row = inner_iter.next
    while inner_row
    	output [outer_row.col1, inner_row.col2];
        inner_row = inner_iter.next;
	end
    outer_row = outer.iter.next;
end

转换为伪代码后如下所示

outer_iter = iterator over tb1 where col1 IN(5,6);
outer_row = outer_iter.next;
while outer_row
	inner_iter = iterator over tb2 where col3 = outer_row.col3;
	inner_row = inner_iter.next
    if inner_row
        while inner_row
            output [outer_row.col1, inner_row.col2];
            inner_row = inner_iter.next;
        end
    else
    	output [outer_row.col1, NULL];
	end
    outer_row = outer.iter.next;
end

另一个方式可视化展现查询计划的方式是使用泳道图的形式。下面的图展示了内连接查询的泳道图。

MySQL 执行的各类查询基本上都是相同的方式。例如，在 FROM 条件里需要先执行的子查询时，也是先将结果放入临时表，然后再把临时表当作普通表后联合来处理。MySQL 执行联合查询时也是使用临时表，然后将右连接查询重写为等价的左连接。简而言之，当前版本的 MySQL 会尽可能把各类查询转成这种方式处理（最新版本 MySQL5.6以后引入了更多的复杂的处理方式）。

当然，并不是所有合法的 SQL 查询语句都可以这么做，有些查询这么做的效果可能很差。

执行计划

MySQL不像其他很多数据库产品，它不会将查询语句产生字节码去执行查询计划。实际上，查询执行计划是一棵指令树，查询执行引擎根据这棵树产生查询结果。最终的查询计划包含了足够多的信息去重构最初的查询。如果在查询语句上执行EXPLAIN EXTENDED（MySQL 8以后不需要加 EXTENDED），然后再执行SHOW WARNINGS，就可以看到重构后的查询。

对于多表查询在概念上可以用树代表。例如，一个4张表的查询可能长得像下面的树一样。这在计算机里称为平衡树，

然而这不是 MySQL 执行查询的方式。如前所述，MySQL 总是从一张数据表开始，然后再从下一张表寻找匹配的数据行。因此，MySQL 的查询计划看起来像下面的左深连接树。

联合查询优化器

MySQL 的查询优化器中最重要的部分是联合查询优化器，由它来决定多表查询执行过程的最优顺序。通常可以通过多种联合查询的次序获取相同的结果。联合查询优化器试图估计这些方案的代价，然后选择最低代价的方案去执行。

下面是一个查询相同结果，但不同次序的联合查询示例。

SELECT film.film_id, film.title, film.release_year, actor.actor_id, actor.first_name, actor.last_name
FROM sakila.film
INNER JOIN sakila.film_actor USING(film_id)
INNER JOIN sakila.actor USING(actor_id);

这里面可能会有一些不同的查询方式。比如，MySQL 可以从 film 表开始，使用 film_actor 的film_id 索引去查找对应的 actor_di 值，然后再从 actor 表使用主键找到对应的 actor 数据行。而 Oracle 用户可能会表述为：“film 表是 film_actor 的驱动表，而 film_actor 是 actor 表的驱动表”。而使用 Explain 解析的结果如下：

******** 1.row ********
id: 1
select_type: SIMPLE
table: actor
type: ALL
possible_keys: PRIMARY
key: NULL
key_len: NULL
ref: NULL
rows: 200
Extra:
******** 2.row ********
id: 1
select_type: SIMPLE
table: film_actor
type: ref
possible_keys: PRIMARY, idx_fk_film_id
key: PRIMARY
key_len: 2
ref: sakila.film.film_id
rows: 1
Extra: USING index
******** 3.row ********
id: 1
select_type: SIMPLE
table: film
type: eq_ref
possible_keys: PRIMARY
key: PRIMARY
key_len: 2
ref: sakila.film_actor.film_id
rows: 1
Extra:

这个执行计划与我们猜想的有很大不同。MySQL 首先从 actor 表开始，然后次序是反向的。这是否真的更有效？我们可以在 EXPLAIN 上加上 STRAIGHT_JOIN 来避免优化：

EXPLAIN SELECT STRAIGHT_JOIN film.film_id, film.title, film.release_year, actor.actor_id, actor.first_name, actor.last_name
FROM sakila.film
INNER JOIN sakila.film_actor USING(film_id)
INNER JOIN sakila.actor USING(actor_id);

******** 1.row ********
id: 1
select_type: SIMPLE
table: film
type: ALL
possible_keys: PRIMARY
key: NULL
key_len: NULL
ref: NULL
rows: 951
Extra:
******** 2.row ********
id: 1
select_type: SIMPLE
table: film_actor
type: ref
possible_keys: PRIMARY, idx_fk_film_id
key: idx_fk_film_id
key_len: 2
ref: sakila.film.film_id
rows: 1
Extra: USING index
******** 3.row ********
id: 1
select_type: SIMPLE
table: actor
type: eq_ref
possible_keys: PRIMARY
key: PRIMARY
key_len: 2
ref: sakila.film_actor.actor_id
rows: 1
Extra:

这解释了为什么MySQL 为什么需要反序执行查询，这会使得检查的数据行更少。

先查询 film 表会需要对 film_actor 和 actor 进行951次查询（最外层循环）
如果将 actor表前置，则只需要对其他表进行200次查询。

从这个例子可以看出，MySQL 的联合查询优化器可以通过调整查询表次序降低查询代价。重新排序后的联合查询通常是很有效的优化，通常是几倍性能的提高。如果没有性能提高的话，也可以使用 STRAIGHT_JOIN 来避免重排序，而使用我们自己认为最好的查询方式。这种情况实际遇到的会很少，大部分情况下，联合查询优化器都会比人做得更出色。

联合查询优化器视图以最低完成代价构建一个查询执行树。如果有可能，它会从全部的单表计划开始，检查所有可能的子树组合。不幸的是，一个 N 张表的联合查询会有 N 个阶乘的组合次序数量。这被称之为所有可能的查询计划的搜索空间，这个数量增长非常快。一个10张表的联合索引会有3628800个不同的方式！一旦搜索空间增长到过大，会导致查询的优化十分久，这时候服务端会停止做全量分析，替代以类似贪婪算法的方式完成优化。这个数量通过 optimizer_search_depth 系统变量控制，可以自己修改该参数。

MySQL全文索引、联合索引、like查询、json查询速度哪个快

查询背景有一个表tmp_test_course大概有10万条记录,然后有个json字段叫outline,存了一对多关系(保存了多个编码,例如jy1577683381775) 我们需要在这10万条数据中检索特定类型的数据,目标总数据量:2931条 SELECT COUNT(*) FROM tmp_test_course WHERE `type`=5 AND del=2 AND is_leaf=1 我们在限定为上面类型的同时,还得包含下面任意一个编码(也就是OR查询) jy157768338177
Mysql联合查询UNION和UNION ALL的使用介绍

一.UNION和UNION ALL的作用和语法 UNION 用于合并两个或多个 SELECT 语句的结果集,并消去表中任何重复行.UNION 内部的 SELECT 语句必须拥有相同数量的列,列也必须拥有相似的数据类型.同时,每条 SELECT 语句中的列的顺序必须相同.SQL UNION 语法: 复制代码代码如下: SELECT column_name FROM table1UNIONSELECT column_name FROM table2 注释:默认地,UNION 操作符选取不同的值.如
Mysql联合查询UNION和Order by同时使用报错问题的解决办法

因此,常常出现这样的错误复制代码代码如下: select * from [IND] where INDID>10unionselect * from [IND] where INDID<9 目前为止,还没有出现问之后,也许有人会用到类似的查询复制代码代码如下: select * from [IND] where INDID>10 order by INDID descunionselect * from [IND] where INDID<9 order by INDID
对MySQL几种联合查询的通俗解释

表a aid adate 1 a1 2 a2 3 a3 表b bid bdate 1 b1 2 b2 4 b4 两个表a.b相连接,要取出id相同的字段. select * from a inner join b on a.aid = b.bid 这是仅取出匹配的数据. 此时的取出的是: 1 a1 b1 2 a2 b2 那么left join 指: select * from a left join b on a.aid = b.bid 首先取出a表中所有数据,然后再加上与a.b匹配的的数据.
mysql多表联合查询返回一张表的内容实现代码

今天在使用mysql语句的时候老是报错,语句如下: Sql代码复制代码代码如下: SELECT sapcle FROM SellEnterpriseBaseInfor sebie,SellEnterpriseBaseInforVer sebive,SellApplyPermitChangeList sapcle WHERE 1=1 AND sebie.iVerID = sebive.id AND sapcle.iEnterpriseBaseInforID=sebive.id AND sapc
详解Mysql多表联合查询效率分析及优化

1. 多表连接类型 1. 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如: SELECT * FROM table1 CROSS JOIN table2 SELECT * FROM table1 JOIN table2 SELECT * FROM table1,table2 由于其返回的结果为被连接的两个数据表的乘积,因此当有WHERE, ON或USING条件的时候一般不建议使用,因为当数据表项目太多的时候,会非常慢.一般使用LE
mysql多表联合查询操作实例分析

本文实例讲述了mysql多表联合查询操作.分享给大家供大家参考,具体如下: MySQL多表联合查询是MySQL数据库的一种查询方式,下面就为您介绍MySQL多表联合查询的语法,供您参考学习之用. MySQL多表联合查询语法: 复制代码代码如下: SELECT * FROM 插入表 LEFT JOIN 主表 ON t1.lvid=t2.lv_id select * from mytable,title where 表名1.name=表名2.writer ; mysql版本大于4.0,使用UNIO
浅谈mysql的子查询联合与in的效率

最近的产品测试发现一个问题,当并发数量小于10时,响应时间可以维持在100毫秒以内.但是当并发数到达30个时,响应时间就超过1秒.这太不能接受了,要求是通过1秒中并发100个. 经过检测发现,时间主要是耗在其中的一个存储过程中.把存储过程的语句一条一条的过一遍也没有发现明显的不合理.因为mysql本身不能提供毫秒级别的时间,google了一个mysql的能提供毫秒的时间函数,再做测试,做了一个定位.发现是其中一条语句,语句是这个样子: select .... from A, B where ..
Mysql两表联合查询的四种情况总结

一般来说,我们为了得到更完整的结果,我们需要从两个或更多的表中获取结果,我一般都是用select xxx,xxx from 表1,表2 where 表1.xxx=表2.xxx,我们一般都是进行的是这般的操作,其实mysql中还有一种操作,那就是join的操作,例如底下有两个表: 请看 "Persons" 表: 接下来请看 "Orders" 表: 以上的这两个表,然后我们把它们进行连接查询 SELECT Persons.LastName, Persons.FirstN
mysql连接查询、联合查询、子查询原理与用法实例详解

本文实例讲述了mysql连接查询.联合查询.子查询原理与用法.分享给大家供大家参考,具体如下: 本文内容: 连接查询联合查询子查询 from子查询 where子查询 exists子查询首发日期:2018-04-11 连接查询: 连接查询就是将多个表联合起来查询,连接查询方式有内连接.外连接.自然连接.交叉连接.连接查询使得可以同时查看多张表中数据. 内连接:有条件连接,多个表之间依据指定条件连接,匹配结果是保留符合匹配结果的记录. 外连接:与内连接不同的是不管匹配符不符合都保留,根据外连接

详解MySQL 联合查询优化机制

MySQL 联合查询执行策略。

执行计划

联合查询优化器

相关推荐

随机推荐