面试官:什么是回表,什么是索引下推?

图解学习网站:

使用 MySQL时,我们经常会听到“回表”、“索引下推”这样的概念,今天就来聊一聊什么是回表,什么是索引下推。

1.回表1.1 概念

我们看下面这个SQL:

CREATETABLE`test_temp`(

`id`INT(11) NOTNULLDEFAULT'0',

`a`VARCHAR(20) DEFAULTNULL,

`b`VARCHAR(10) DEFAULTNULL,

PRIMARY KEY(`id`),

KEY(`b`)

) ENGINE=INNODBDEFAULTCHARSET=utf8

我们创建一个test_temp 表, 主键是id, 给字段b 加了一个索引。插入4 条数据,SQL 如下:

INSERTINTOtest_temp(100, 10, 50);

INSERTINTOtest_temp(200, 20, 40);

INSERTINTOtest_temp(300, 30, 30);

INSERTINTOtest_temp(400, 40, 10);

test_temp 表会构建 2 个索引,一个是主键索引,一个是字段 b 的普通索引。

一般主键索引被称为聚集索引,普通索引被称为非聚集索引。

一般主键索引被称为聚集索引,普通索引被称为非聚集索引。

我们执行下面查询SQL:

select* fromtest_temp whereb in(10, 20, 30,40);

这个 SQL语句的查询过程如下图:

今日霍州(www.jrhz.info)©️

jrhz.info

1.从索引 b 上查询 10, 查到主键id 的值是 400,再用 400 这个 id 去主键索引上取出row4;

2. 从索引b 上查询20, 没有查到记录,继续下一条;

3. 从索引b 上查询30, 查到主键id 的值是300,再用 300 这个 id 去主键索引上取出row3;

4.从索引 b 上查询 40, 查到主键id 的值是 200, 再用200 这个 id 去主键索引上取出 row2;

5. 给客户端返回结果集。

上面 1、3、5 回到主键索引搜索数据的过程,就叫回表。上面查询回表3 次。

1.2 缺点

回表有什么问题吗?回表次数多了,可能会严重影响查询效率。

1.导致磁盘 I/O增加:每次回表读取数据行,这些数据分散在磁盘各个地方,导致大量的磁盘 I/O。

2.导致缓存失效:回表的数据如果不在缓存行中,就需要从磁盘加载,新的数据可能会覆盖已有的缓存,影响其他查询。

1.3 措施

那有什么方法可以避免回表吗?下面两个方法可以避免:

1.覆盖索引

上面的查询中,如果 SQL改成:

selectb, idfromtest_temp whereb in(10, 20, 30,40);

这样就不用回表查询了。如果需要查询 b、a 两个字段,可以创建 b、a 的覆盖索引,这样就可以从 b、a 这个覆盖索引上查询出结果。

2.只查询必要字段

修改查询范围,不用的字段不查询。如果查询的字段不多,可以把查询语句改成只查联合索引包含的字段。如果查询频率高,又没有覆盖索引,可以加一个包含查询字段的联合索引。

2.索引下推

首先回顾一下 MySQL的逻辑架构:

今日霍州(www.jrhz.info)©️

Server层是 MySQL的核心服务层,这一次包括查询解析、分析、优化、缓存、以及所有内置函数(例如,日期、时间、数学和加密函数),所有跨存储引擎的功能都在这一层实现,包括:存储过程、触发器、视图等。

存储引擎层负责 MySQL 中数据的存储和提取。

首先,我们创建一张表:

CREATETABLE`test_temp`(

`id`INT(11) NOTNULLDEFAULT'0',

`a`VARCHAR(20) DEFAULTNULL,

`b`VARCHAR(10) DEFAULTNULL,

`c`VARCHAR(10) DEFAULTNULL,

`d`VARCHAR(10) DEFAULTNULL,

PRIMARY KEY(`id`),

KEY`a_b`(`a`,`b`)

) ENGINE=INNODBDEFAULTCHARSET=utf8

插入一批数据:

INSERTINTOtest_temp VALUES(100, 10, 20, 2, 1);

INSERTINTOtest_temp VALUES(200, 10, 40, 4, 2);

INSERTINTOtest_temp VALUES(300, 10, 30, 3, 3);

INSERTINTOtest_temp VALUES(400, 40, 10, 1, 4);

这时我们看一下下面这条 SQL的执行计划:

EXPLAINSELECT* FROMtest_temp WHEREa > '10'ANDb < '50';

我们看一下执行计划:

上图中的Using index condition 就是使用了索引下推。

如果不使用索引下推,比如只对 a 这个字段加了索引,那就会对 a 这个字段筛选出来的 id,依次做回表查询,查到结果后再对 b 字段进行过滤。

而使用了索引下推,SQL执行过程如下:

1.Server层向存储引擎查询数据;

2.存储引擎根据 a_b联合索引首先找到所有 a > '10'的数据,根据联合索引中已经存在的 b 字段对数据做过滤,找出符合条件 b < '50'的数据;

3.存储引擎根据 a_b联合索引找到所有符合条件的数据后,回表查询,给 Server层返回结果集。

可以看到,索引下推最大的优势就是在存储引擎层,利用联合索引的优势对查询条件进行了过滤,这样可以减少回表查询次数,从而大大减少 I/O次数,提升查询性能。

索引下推是在MySQL 5.6 版本中才引入的,MySQL 5.6 以前版本没有这个功能。

索引下推是在MySQL 5.6 版本中才引入的,MySQL 5.6 以前版本没有这个功能。

当然使用索引下推也有一定限制:

1. 索引下推主要适用于eq_ref、range、ref、ref_or_null 这几个场景;

2.InnoDB 和 MyISAM 存储引擎都支持索引下推,MySQL 分区表也支持;

3.对 InnoDB 存储引擎来说,索引下推只适用于二级索引,主键索引(聚集索引)不支持,因为主键索引存储了数据,不存在回表这一说;

4. 语句中子查询的条件不支持索引下推;

5. 使用了存储函数的 SQL,存储函数中的条件不支持索引下推,因为存储引擎无法调用存储函数。

我们再看下面这个查询语句(把条件 b 改成条件 c):

EXPLAINSELECT* FROMtest_temp WHEREa > '10'ANDc < '50';

这个语句其实并不能使用联合索引第二个字段在存储引擎层做过滤,还是需要对每一条索引 a_b 上查询到的 id 做回表查询,但是执行计划里面却有索引下推,这也是需要注意的一点。

总结

本文介绍了 MySQL的回表和索引下推,这两个概念在 MySQL中非常重要,希望对你的学习和面试有所帮助。

特别声明:[面试官:什么是回表,什么是索引下推?] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

王石大女儿比后妈还年长,45 岁坚守不婚,老父亲愁白了头(王石大儿子?)

最近,王石与田朴珺的婚变风波引发了广泛关注,这也不禁让人想起了王石那个鲜少露面的女儿——王蔚蓝。看到父亲在大家面前忧心忡忡地谈论自己的私生活,王蔚蓝没有像年轻时那样默默忍受,而是当场回敬了一句相当直白的话:管…

王石大女儿比后妈还年长,45 岁坚守不婚,老父亲愁白了头(王石大儿子?)

1.2米女孩嫁1.3米丈夫,结婚12年无儿无女,如今单身实现财富自由(1.2米的女人)

也有一些老师为她的坚持深感动容,特地为她定制了加高的把杆和矮阶训练台;同学们也会主动帮她取下高处的物品,陪她走夜路回宿舍……这些温暖的举动,像涓涓细流,悄然滋润着她孤独而坚韧的心灵。 2011年,他们在亲…

1.2米女孩嫁1.3米丈夫,结婚12年无儿无女,如今单身实现财富自由(1.2米的女人)

煤化工废水膜法深度处理与盐分协同控制技术路线(煤化工废水来源)

采用以“纳滤分盐”和“反渗透深度脱盐”为核心的膜集成工艺,是针对煤化工废水实现污染物深度去除与盐分资源化的有效且必要的技术路径。其成功应用依赖于对水质特性的精准分析、合理的预处理保障、科学的膜工艺组合设计,…

煤化工废水膜法深度处理与盐分协同控制技术路线(煤化工废水来源)

外交部提醒:春节期间避免前往日本 安全威胁升级

近期,日本社会治安问题频发,针对中国公民的违法犯罪案件增多。部分地区接连发生地震,导致人员受伤,日本政府已发出后续地震警告⚠️,中国公民在日本面临严重安全威胁。农历春节临近,外交部和中国驻日本使领馆提醒中国公民近期避免前往日本

外交部提醒:春节期间避免前往日本 安全威胁升级

十三邀》第九季开播,许知远在长期主义中寻找生命议题(十三邀第九季免费观看全集在线播放)

在与他们的对话中,许知远深入那些具体真实的生命议题,关于根源与创作、理解与抉择、局限与超越,节目试图在普遍的喧嚣与变动中,探求个体如何守护热忱、淬炼信念,为观众提供参照和启发。 对于第九季主题“崭新的开始”,…

《<strong>十三邀</strong>》第九季开播,许知远在长期主义中寻找生命议题(十三邀第九季免费观看全集在线播放)