联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

全栈程序员-站长 • 2022年6月4日上午9:00 • 未分类 • 阅读 29

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]最困难的事情就是认识自己！个人网站，欢迎访问！前言：本篇文章主要是阐述下联合索引在B+Tree上的实际存储结构。本文主要讲解的内容有：联合索引在B+树上的存储结构联合索引的查找方式为什么会有最左前缀匹配原则在分享这篇文章之前，我在网上查了关于MySQL联合索引在B+树上的存储结构这个问题，翻阅了很多博客和技术文章，其中有几篇讲述的与事实相悖。具体如下：很多博客中都是说：联合索引在B+树上的非叶子节点中只会存储联合索引中的第一个索引字段的.

大家好，又见面了，我是你们的朋友全栈君。

最困难的事情就是认识自己！

个人网站，欢迎访问！

前言：

本篇文章主要是阐述下 联合索引 在 B+Tree 上的实际存储结构。

本文主要讲解的内容有：

联合索引在B+树上的存储结构
联合索引的查找方式
为什么会有最左前缀匹配原则

在分享这篇文章之前，我在网上查了关于MySQL联合索引在B+树上的存储结构这个问题，翻阅了很多博客和技术文章，其中有几篇讲述的与事实相悖。具体如下：

很多博客中都是说：联合索引在B+树上的 非叶子节点 中只会存储联合索引中的第一个索引字段的值，联合索引的其余索引字段的值只会出现在 B+树的 叶子节点 中。（其实这句话是不对的）

如下图，就是 错误的 联合索引的 B+树存储结构图：

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

庆幸的是通过查询发现有一条是来自思否社区的关于【联合索引在 B+Tree 上的存储结构？】问答，有答主回答了这个问题，并贴出了一篇文章和一张图以及一句简单的描述。 PS：贴出的文章链接已经打不开了 。

所以在这样的条件下本篇文章就诞生了。

联合索引存储结构：

下面就引用思否社区的这个问答来展开我们今天要讨论的联合索引的存储结构的问题。

来自思否的提问，联合索引的存储结构
(https://segmentfault.com/q/1010000017579884)
有码友回答如下：

联合索引 bcd , 在索引树中的样子如下图，在比较的过程中，先判断 b 再判断 c 然后是 d ：

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

由于回答只有这么一张图一句话，可能会让大家有点看不懂，所以我们就借助前人的肩膀用这个例子来更加细致的讲探寻一下联合索引在B+树上的存储结构吧。

首先，有一个T1表，然后表T1有字段a,b,c,d,e，其中a是主键，除e为varchar其余为int类型，并创建了一个联合索引idx_t1_bcd(b,c,d)，然后b、c、d三列作为联合索引，在B+树上的结构正如上图所示。联合索引的所有索引列都出现在索引数上，并依次比较三列的大小。上图树高只有两层不容易理解，下面是假设的表数据以及我对其联合索引在B+树上的结构图的改进。 PS：基于InnoDB存储引擎。

index（b、c、d）联合索引在B+树上的结构图如下：

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

T1表中的数据如下图：（ 上图 B+树中的数据就来自下图 ）

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

通过这俩图我们心里对联合索引在B+树上的存储结构就有了个大概的认识。下面用我的语言为大家解释一下吧。

我们先看T1表，他的主键暂且我们将它设为整型自增的，InnoDB会使用主键索引在B+树维护索引和数据文件，然后我们创建了一个联合索引（b，c，d）也会生成一个索引树，同样是B+树的结构，只不过它的 data部分 存储的是联合索引所在行记录的主键值 （上图叶子节点紫色背景部分） 。为什么是主键值，而不是整个行记录呢？因为这个联合索引是个 非聚簇索引 。

好了大致情况都介绍完了。下面我们结合这俩图来解释一下。

对于联合索引来说只不过比单值索引多了几列，而这些索引列全都出现在索引树上。对于联合索引，存储引擎会首先根据第一个索引列排序，如上图我们可以单看第一个索引列，如，1 1 5 12 13…它是单调递增的；如果第一列相等则再根据第二列排序，依次类推就构成了上图的索引树，上图中的1 1 4 ，1 1 5以及13 12 4, 13 16 1, 13 16 5就可以说明这种情况。

联合索引具体查找步骤：

当我们的SQL语言可以应用到索引的时候，比如 select * from T1 where b = 12 and c = 14 and d = 3 ；也就是T1表中a列为4的这条记录。

查找步骤具体如下：

存储引擎首先从根节点（一般常驻内存）开始查找，第一个索引的第一个索引列为1,12大于1，第二个索引的第一个索引列为56,12小于56，于是从这俩索引的中间读到下一个节点的磁盘文件地址（此处实际上是存在一个指针的，指向的是下一个节点的磁盘位置）。
进行一次磁盘IO，将此节点值加载后内存中，然后根据第一步一样进行判断，发现数据都是匹配的，然后根据指针将此联合索引值所在的叶子节点也从磁盘中加载后内存，此时又发生了一次磁盘IO，最终根据叶子节点中索引值关联的 主键值 。
根据主键值回表去主键索引树（聚簇索引）中查询具体的行记录。

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

联合索引的最左前缀原则：

之所以会有最左前缀匹配原则和联合索引的索引构建方式及存储结构是有关系的。

首先我们创建的idx_t1_bcd(b,c,d)索引，相当于创建了(b)、（b、c）（b、c、d）三个索引，看完下面你就知道为什么相当于创建了三个索引。

我们看，联合索引是首先使用多列索引的第一列构建的索引树，用上面idx_t1_bcd(b,c,d)的例子就是优先使用b列构建，当b列值相等时再以c列排序，若c列的值也相等则以d列排序。我们可以取出索引树的叶子节点看一下。

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

索引的第一列也就是b列可以说是从左到右单调递增的，但我们看c列和d列并没有这个特性，它们只能在b列值相等的情况下这个小范围内递增，如第一叶子节点的第1、2个元素和第二个叶子节点的后三个元素。

由于联合索引是上述那样的索引构建方式及存储结构，所以联合索引只能从多列索引的第一列开始查找。所以如果你的查找条件不包含b列如（c,d）、(c）、(d)是无法应用缓存的，以及跨列也是无法完全用到索引如(b,d)，只会用到b列索引。

这就像我们的电话本一样，有名和姓以及电话，名和姓就是联合索引。在姓可以以姓的首字母排序，姓的首字母相同的情况下，再以名的首字母排序。

如：

M
    毛 不易   178********
    马 化腾   183********
    马 云     188********
Z
    张 杰     189********
    张 靓颖   138********
    张 艺兴   176********

我们知道名和姓是很快就能够从姓的首字母索引定位到姓，然后定位到名，进而找到电话号码，因为所有的姓从上到下按照既定的规则（首字母排序）是有序的，而名是在姓的首字母一定的条件下也是按照名的首字母排序的，但是整体来看，所有的名放在一起是无序的，所以如果只知道名查找起来就比较慢，因为无法用已排好的结构快速查找。

到这里大家是否明白了为啥会有最左前缀匹配原则了吧。

实践：

如下列举一些SQL的索引使用情况：

select * from T1 where b = 12 and c = 14 and d = 3;-- 全值索引匹配 三列都用到
select * from T1 where b = 12 and c = 14 and e = 'xml';-- 应用到两列索引
select * from T1 where b = 12 and e = 'xml';-- 应用到一列索引
select * from T1 where b = 12  and c >= 14 and e = 'xml';-- 应用到一列索引及索引条件下推优化
select * from T1 where b = 12  and d = 3;-- 应用到一列索引 因为不能跨列使用索引 没有c列 连不上
select * from T1 where c = 14  and d = 3;-- 无法应用索引，违背最左匹配原则

后记：

到这里MySQL索引的联合索引的存储结构及查找方式就讲完了，本人能力有限，也是站着前人的肩膀上创作的此文，因为看到搜索引擎的搜索结果前几个技术文章中有存在讲述不清或讲述有误的地方，所以自己才总结出这篇文章分享给大家，如有不对的地方一定要指正哦，谢谢了。

通过本文了解到了联合索引的存储结构及查找方式，那在项目中该怎么创建索引呢？请参考此文：项目中该如何创建索引？

❤不要忘记留下你学习的足迹 [点赞 + 收藏 + 评论]嘿嘿ヾ

一切看文章不点赞都是“耍流氓”，嘿嘿ヾ(◍°∇°◍)ﾉﾞ！开个玩笑，动一动你的小手，点赞就完事了，你每个人出一份力量(点赞 + 评论)就会让更多的学习者加入进来！非常感谢！￣ω￣=

个人原创Java技术文公众号，欢迎大家关注；关注后如果不香，来捶我啊！嘿嘿。。。。。。

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/136085.html原文链接：https://javaforall.net

数据

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

怎么进行大数据测试？我们需要具备怎样的测试能力？「建议收藏」

上一篇 2022年6月4日上午8:46

Matlab插值方法大全

下一篇 2022年6月4日上午9:00

Windows 10上如何安装ubuntu虚拟机「建议收藏」

因为开发的需要，很多时候时候我们需要安装虚拟机，然后在虚拟机上面安装我们需要的操作系统。最近也是因为学习的需要，就用自己的Windows10安装了ubuntu虚拟机，在虚拟机上面安装需要的操作系统，下面是具体的操作过程。一下载准备文件（1）先去下载VirtualBox，这里我用的版本是VirtualBox-6.1.4-136177-Win.exe，官网地址：https://www.vi…

全栈程序员-站长
2022年4月17日
359
python代码编译发布为可执行文件【保姆级别操作指导，建议收藏】

python代码编译发布为可执行文件【保姆级别操作指导，建议收藏】今天群里有朋友问到如何讲 python 编译为 exe 文件刚好有时间现写了 PyInstaller 这是官网的说明好像挺 6 的多方便啊安装然后就可以编译 python 程序成为 exe 可执行文件了确认安装好 pip 参考快速安装并掌握 pip 使用 pip 安装 pyinstaller 执行下面代码 pipinstallpy 效果如下比如我想要编译打包 demo py 这个 python 程序 demo py 程序代码如下 importtimewh t

全栈程序员-站长
2026年3月20日
3
SpringBoot 自动配置原理[通俗易懂]

SpringBoot 自动配置原理[通俗易懂]创建项目通过SpringInitialize创建SpringBoot项目而接下来要说的是关于配置文件的事情。关乎配置文件可以参考官方文档。对于配置文件来说到底在配置文件里面可以进行配置那些内容，自动配置的原理又是什么东西呢？自动配置原理在SpringBoot启动的时候加载主配置类，开启了自动配置的功能，通过@EnableAutoConfiguration注解开启自动配置的功能。@Im…

全栈程序员-站长
2022年6月17日
25
eureka注册中心原理_腾讯实名认证中心

eureka注册中心原理_腾讯实名认证中心英文版的官方教程搭建Eruka注册中心很简单，三个步骤1增加项目依赖，改pom文件2为Eruka新增配置文件3启动类加@EnableEurekaServer注解以上三个步骤。这篇文章很详细（此文看上半部分即可，下半部分是搭建多个Eruka集群，他们之间可相互通讯同步）。新建一个boot项目，里面只需要pom文件、配置文件Application.properties，和启动类三个文件就可以了。…

全栈程序员-站长
2022年8月21日
9
Druid连接池的意义以及使用

Druid连接池的意义以及使用建立数据库连接耗时耗费资源，一个数据库服务器能够同时建立的连接数也是有限的，在大型的Web应用中，可能同时会有成百上千的访问数据库的请求，如果Web应用程序为每一个客户请求分配一个数据库连接，将导致性能的急剧下降。数据库连接池的意义在于，能够重复利用数据库连接（有点类似线程池的部分意义），提高对请求的响应时间和服务器的性能。连接池中提前预先建立了多个数据库连接对象，然后将连接对象保存到连接池中…

全栈程序员-站长
2022年7月23日
8
SVN目录对号图标（更新、冲突）不显示

SVN目录对号图标（更新、冲突）不显示

全栈程序员-站长
2022年1月9日
69

联合索引在B+Tree上的存储结构及数据查找方式[通俗易懂]

前言：

联合索引存储结构：

联合索引具体查找步骤：

联合索引的最左前缀原则：

实践：

后记：

❤不要忘记留下你学习的足迹 [点赞 + 收藏 + 评论]嘿嘿ヾ

关于作者

全栈程序员-站长

相关推荐

Windows 10上如何安装ubuntu虚拟机「建议收藏」

python代码编译发布为可执行文件【保姆级别操作指导，建议收藏】

SpringBoot 自动配置原理[通俗易懂]

eureka注册中心原理_腾讯实名认证中心

Druid连接池的意义以及使用

SVN目录对号图标（更新、冲突）不显示

发表回复