各种 SQL 的执行计划实战分析

网友投稿 650 2022-05-29

各种 SQL 的执行计划实战分析

每条SQL语句,MySQL都会经过成本和规则的优化,对这个SQL选择对应的一些访问方法和顺序,包括做一些特殊的改写确保执行效率是最优的,然后优化过后,就会得到一个执 行计划。

执行计划,落实到底层,无非就是先访问哪个表,用哪个索引还是全表扫描,拿到数据后如何回表,是否要基于临时磁盘文件做分组聚合或者排序。

简单的单表查询,可能这就一条数据,代表它打算如何访问这一个表。

explain select * from t1

这里直接会扫描表的聚簇索引的叶节点,按顺序扫描过去拿到表里全部数据。

rows=32,说明这个表里就32条数据,全表扫描会全扫出来

filtered=100%,无where过滤条件,所以直接筛选出来的数据就是表里数据的100%占比。

1 多表关联语句

explain select * from t1 join t2

这种关联语句会选择一个表先查询出来数据, 接着遍历每一条数据去另外一个表里查询可以关联在一起的数据,然后关联。

因为是多表关联,其执行计划分为两条,即会访问两个表:

第一个表t1,先用ALL方式全表扫描,扫出xxx条数据

第二个表访问t2,同样ALL全表扫描,这种多表关联是笛卡尔积,t1表的每条数据都会去t2表全表扫描所有yyy条数据,跟t2表的每条数据都会关联。extra是Nested Loop(MySQL5.7 老版本值,8.0 版本为图中所示的优化),即嵌套循环的访问方式

两条执行计划的id都是1,一般执行计划里,一个SELECT会对应一个id,因为这两条执行计划对应的是一个SELECT语句,所以他们俩的id都是1,是一样。

如果你要是有一个子查询,有另外一个SELECT,那么另外一个SELECT子查询对应的执行计划的id就是2。

2 包含子查询

explain select * from citizen where name in (select name from user) or age = 18;

主SELECT语句的WHERE筛选条件是依赖子查询,还有一个自己的WHERE筛选条件。

该SQL里有两个SELECT:

主查询SELECT的执行计划的id=1

子查询SELECT的执行计划的id=2

第一个执行计划的select_type=PRIMARY,查询类型是主查询。主查询有个where条件age=18,所以其possible_keys包含age索引,但key是NULL且type是ALL,说明没选择age字段索引,而是全表扫描,why?可能MySQL分析成本,使用age字段索引扫描18这个值,几乎就跟全表扫描差不多,可能age字段值几乎都是18,所以最后就选择还不如直接全表扫描。

第二个执行计划select_type=SUBQUERY,即子查询,子查询针对t2表,子查询本身就是个全表查询,但对主查询而言,会使用name in筛选条件,type=index,说明使用了扫描name字段的二级索引,直接扫描name二级索引,来跟子查询的结果集做比对。

3 union SQL

EXPLAIN SELECT * FROM t1 UNION SELECT * FROM t2

这是一个典型的union语句,把两个表的查询结果合并起来。

执行计划的:

第一、二条,两个SELECT子句对应两个id,分别从t1、t2表里全表扫描

第三条,union子句默认把两个结果集合并且去重,所以该执行计划其实就是去重

所以其table=,临时表的表名,extra=using temporary,即使用临时表的意思,把结果集放到临时表里进行去重的意思。若用union all,就不会去重。

SQL

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【鲲鹏迁移及实践帖子汇总】第一弹~~
下一篇:DevOps国际峰会| 华为AIOps助力ICT智能化运维转型
相关文章