引言:
覆盖索引是一种利用二级索引的叶子节点包含了所有需要查询的列数据,从而避免回表操作的查询方式。回表操作是指通过二级索引找到主键值,再根据主键值在聚簇索引中查找完整的记录。回表操作会增加磁盘的随机IO,降低查询效率。使用覆盖索引可以减少树的搜索次数,提升查询性能。
先了解三个概念:
InnoDB索引模型:
在InnoDB中,表都是根据主键顺序以索引的形式存放的,这种存储方式的表称为索引组织表。InnoDB使用了B+树索引模型,所以数据都是存储在B+树中的。
主键索引和非主键索引的区别
主键索引又叫聚簇索引,非主键索引又叫普通索引,那么这两种索引有什么区别呢?
主键索引的叶子节点存放的是整行数据,非主键索引的叶子节点存放的是主键的值。
假设有一张User表(id,age,name,address),其中有id和age两个字段,其中id是主键,age是普通索引,有几行数据u1-u5的(id,age)的值是(100,1)、(200,2)、(300,3)、(500,5)和(600,6) ,此时的两棵树的示例如下:
从上图可以看出来,基于主键索引的树的叶子节点存放的是整行User数据,基于普通索引age的叶子节点存放的是id(主键)的值。
总结区别:
- 聚簇索引是指按照数据的物理顺序存储的索引,通常是主键索引。聚簇索引的叶子节点直接存储了数据行,因此通过聚簇索引可以快速找到数据。一个表只能有一个聚簇索引。
- 非聚簇索引是指按照数据的逻辑顺序存储的索引,通常是普通索引或唯一索引。非聚簇索引的叶子节点存储了主键值或者指针,因此通过非聚簇索引需要再次回表查询数据。一个表可以有多个非聚簇索引。
- 聚簇索引和非聚簇索引的性能优劣取决于查询语句和数据量。一般来说,聚簇索引对于范围查询和全表扫描更有优势,而非聚簇索引对于单点查询和覆盖查询更有优势。
什么是回表?
假设有一条查询语句如下:
select * from user where age=3;
上面这条sql语句执行的过程如下:
- 根据age这个普通索引在age索引树上搜索,得到主键id的值为300。
- 因为age索引树并没有存储User的全部数据,因此需要根据在age索引树上查询到的主键id的值300再到id索引树搜索一次,查询到了u3。
- 返回结果。
上述执行的过程中,从age索引树再到id索引树的查询的过程叫做回表(回到主键索引树搜索的过程)。
也就是说通过非主键索引的查询需要多扫描一棵索引树,因此需要尽量使用主键索引查询。
为什么使用覆盖索引?
有了上述提及到的几个概念,便能很清楚的理解为什么覆盖索引能够提升查询效率了,因为少了一次回表的过程。
假设我们使用覆盖索引查询,语句如下:
select id from user where age=3;
这条语句执行过程很简单,直接在age索引树中二级索引叶子节点就能查询到id的值,不用再去id索引树中查找其他的数据,避免了回表。
总结:
覆盖索引的使用能够减少树的搜索次数,避免了回表,显著提升了查询性能,因此覆盖索引是一个常用的性能优化手段。