mysql IS NULL 使用索引

mysql IS NULL 使用索引简介 mysql 的 sql 查询语句中使用 isnull isnotnull 对索引并没有任何影响 并不会因为 where 条件中使用了 isnull isnotnull 这些判断条件导致索引失效而全表扫描 mysql 官方文档也已经明确说明 isnull 并不会影响索引的使用 MySQLcanperf nameIS

简介

mysql的sql查询语句中使用is nullis not null!=对索引并没有任何影响,并不会因为where条件中使用了is nullis not null!=这些判断条件导致索引失效而全表扫描。

mysql官方文档也已经明确说明is null并不会影响索引的使用。

MySQL can perform the same optimization on col_name IS NULL that it can use for col_name = constant_value. For example, MySQL can use indexes and ranges to search for NULL with IS NULL.

事实上,导致索引失效而全表扫描的通常是因为一次查询中回表数量太多。mysql计算认为使用索引的时间成本高于全表扫描,于是mysql宁可全表扫描也不愿意使用索引。

案例

CREATE TABLE `user_info` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(11) DEFAULT NULL, `age` int(4) DEFAULT NULL, PRIMARY KEY (`id`), KEY `index_name` (`name`) USING BTREE ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; 
INSERT INTO `user_info` (`id`, `name`, `age`) VALUES ('1', 'tom', '18'); INSERT INTO `user_info` (`id`, `name`, `age`) VALUES ('2', null, '19'); INSERT INTO `user_info` (`id`, `name`, `age`) VALUES ('3', 'cat', '20'); 

执行sql查询时使用is nullis not null,发现依然使用的索引查询,并没有出现索引失效的问题。

在这里插入图片描述

在这里插入图片描述

分析

分析上述现象,则需要详细了解mysql索引的工作原理以及索引数据结构。下面,分别通过工具解析和直接查看二进制文件两种方式分别分析mysql索引数据结构。

工具解析

innodb_ruby是一个非常强大的mysql分析工具,可以用来轻松解析mysql的.ibd文件进而深入理解mysql的数据结构。

首先安装innodb_ruby工具:

yum install -y rubygems ruby-deve gem install innodb_ruby 

innodb_ruby的功能很多,此处我们只需要用来解析mysql的索引结构,因此只需要如下的命令即可。更多的功能和命令详见wiki。

innodb_space -s ibdata1 -T sakila/film -I PRIMARY index-recurse 

解析主键索引:

$ innodb_space -s /usr/soft/mysql-5.6.31/data -T test/user_info -I PRIMARY index-recurse ROOT NODE #3: 3 records, 89 bytes RECORD: (id=1) → (name="tom", age=18) RECORD: (id=2) → (name=:NULL, age=19) RECORD: (id=3) → (name="cat", age=20) 

解析普通索引index_name

$ innodb_space -s /usr/soft/mysql-5.6.31/data -T test/user_info -I index_name index-recurse ROOT NODE #4: 3 records, 38 bytes RECORD: (name=:NULL) → (id=2) RECORD: (name="cat") → (id=3) RECORD: (name="tom") → (id=1) 

通过解析工具数据mysql的索引结构可以发现,null值也被储存到了索引树中,并且null值被处理成最小的值放在index_name索引树的最左侧。

二进制文件

找到user_info表对应的物理文件user_info.ibd,通过软件例如UltraEdit打开,直接定位到第5个数据页(mysql默认一个数据页占用16KB)。

在这里插入图片描述

如图,这些二进制数据就是index_name索引对应的索引页数据,只挑选其中的索引记录,展开如下:

最小记录0x00010063

01 B2 01 00 02 00 29 记录头信息 69 6E 66 69 6D 75 6D 最小记录(固定值infimum) 

最大记录0x00010070

00 04 00 0B 00 00 记录头信息 73 75 70 72 65 6D 75 6D 最大记录(固定值supremum) 

ID为1的索引0x0001007f

03 00 00 00 10 FF F1 记录头信息 74 6F 6D 字段name的值:tom 80 00 00 01 RowID:主键id的值为1 

ID为2的索引0x0001008c

01 00 00 18 00 0B 记录头信息 字段name的值:null 80 00 00 02 RowID:主键id的值为2 

ID为3的索引0x00010097

03 00 00 00 20 FF E8 记录头信息 63 61 74 字段name的值:cat 80 00 00 03 RowID:主键id的值为3 

最小记录的记录头信息最后2字节00 29 -> 0x00010063偏移0x0029 -> 0x0001008C,即ID为2的索引位置;

ID为2的记录头信息最后2字节00 0B -> 0x0001008C偏移0x000B -> 0x00010097,即ID为3的索引位置;

ID为3的记录头信息最后2字节FF E8 -> 0x00010097偏移0xFFE8 -> 0x0001007F,即ID为1的索引位置;

ID为1的记录头信息最后2字节FF F1 -> 0x0001007F偏移0xFFF1 -> 0x00010070,最大记录的记录位置;

由此可见索引记录是通过单向链表并以索引值排序串联在一起,而null值被处理成最小的值放在了索引链表的最开始位置,也就是索引树的最左侧。与innodb_ruby工具解析出来的结果一致。

误解原因

为何大众误解认为is nullis not null!=这些判断条件会导致索引失效而全表扫描呢?

导致索引失效而全表扫描的通常是因为一次查询中回表数量太多。mysql计算认为使用索引的时间成本高于全表扫描,于是mysql宁可全表扫描也不愿意使用索引。使用索引的时间成本高于全表扫描的临界值可以简单得记忆为20%左右。

详细的分析过程可以见笔者的另一篇博客:mysql回表致索引失效。

也就是如果一条查询语句导致的回表范围超过全部记录的20%,则会出现索引失效的问题。而is nullis not null!=这些判断条件经常会出现在这些回表范围很大的场景,然后被人误解为是这些判断条件导致的索引失效。

复现索引失效

复现索引失效,只需要回表范围超过全部记录的20%,如下插入1000条非null记录。

delimiter // CREATE PROCEDURE init_user_info() BEGIN DECLARE indexNo INT; SET indexNo = 0; WHILE indexNo < 1000 DO START TRANSACTION; insert into user_info(name,age) values (concat(floor(rand()*)),floor(rand()*100)); SET indexNo = indexNo + 1; COMMIT; END WHILE; END // delimiter ; call init_user_info(); 

此时user_info表中一共有1003条记录,其中只有1条记录的name值为null。那么is null判断语句导致的回表记录只有1/1003不会超过临界值,而is not null判断语句导致的回表记录有1002/1003远远超过临界值,将出现索引失效的现象。

由下两图也可以见,is null依然正常使用索引,而is not null如预期由于回表率太高而宁可全表扫描也不使用索引。

在这里插入图片描述

在这里插入图片描述

使用mysql的optimizer tracing(mysql5.6版本开始支持)功能来分析sql的执行计划:

SET optimizer_trace="enabled=on"; explain select * from user_info where name is not null; SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE; 

optimizer tracing输出的执行计划可见,该查询下,使用全表扫描所需要的时间成本为206.9;而使用索引所需要的时间成本为1203.4,远远高于全表扫描。因此mysql最终选择全表扫描而出现索引失效的现象。

{ "rows_estimation": [ { "table": "`user_info`", "range_analysis": { "table_scan": { "rows": 1004, // 全表扫描需要扫描1004条记录 "cost": 206.9 // 全表扫描需要的成本为206.9 }, "potential_range_indices": [ { "index": "PRIMARY", "usable": false, "cause": "not_applicable" }, { "index": "index_name", "usable": true, "key_parts": [ "name", "id" ] } ], "setup_range_conditions": [], "group_index_range": { "chosen": false, "cause": "not_group_by_or_distinct" }, "analyzing_range_alternatives": { "range_scan_alternatives": [ { "index": "index_name", "ranges": [ "NULL < name" ], "index_dives_for_eq_ranges": true, "rowid_ordered": false, "using_mrr": false, "index_only": false, "rows": 1002, // 索引需要扫描1002条记录 "cost": 1203.4, // 索引需要的成本为1203.4 "chosen": false, "cause": "cost" } ], "analyzing_roworder_intersect": { "usable": false, "cause": "too_few_roworder_scans" } } } } ] } 
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/177074.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午8:22
下一篇 2026年3月26日 下午8:22


相关推荐

  • jmeter模拟用户登录并发_jmeter模拟用户登录并发

    jmeter模拟用户登录并发_jmeter模拟用户登录并发第一种方案直接从数据库中获取账号和密码1、设置线程数为20,我们的并发用户量就是20个用户同时登录2、添加定时器3、设置集合点,当用户数量达到20个的时候再同时请求进行登录操作4、添加配置元件:JDBCConnectionConfiguration5、添加JDBCrequest请求(从数据库获取登录账号和密码)7、添加http登录请求8、查看结果第二种方案对登录账号和密码进行参数化1、添加…

    2026年4月19日
    4
  • 淘宝,天猫,京东,苏宁抢购茅台、手机等脚本(适合兼职,亲测可用)「建议收藏」

    淘宝,天猫,京东,苏宁抢购茅台、手机等脚本(适合兼职,亲测可用)「建议收藏」由来:最近用钱比较多,缺钱,自己也是除了一份死工资就没有别的收入了,而且每个月的工资发了就立马还给了马爸爸,所以一直在想是不是工作之余搞点什么兼职做做,但是一直也是找不到什么门路。碰巧看到uc给我推了一个文章(其实一直有推只是之前没有想法每注意),说天猫,京东,苏宁这些网购平台的茅台90%都是买来卖的,一瓶利润能有一千块。我顿时有了想法,就想着能不能搞个脚本啥的去抢抢,总比自己手动来得好,然后就上网去找脚本,修修补补改改,基于别人的基础上搞了个脚本(目前只有安卓版,后续可能会出苹果的)。然后坚持了几天,

    2022年5月16日
    106
  • mac 修改pip镜像为国内镜像

    mac 修改pip镜像为国内镜像在终端进入目录 cd pip 如果没有 pip 文件夹 新建文件夹 mkdir pipcd pipnanopip conf 粘贴如下内容 global index url http mirrors aliyun com pypi simple install trusted host mirrors aliyun com 或者清华镜像源

    2026年3月17日
    2
  • 所谓抽象就是对同一类事物的相同特性的提取「建议收藏」

    所谓抽象就是对同一类事物的相同特性的提取「建议收藏」所谓抽象就是对同一类事物的相同特性的提取

    2022年4月24日
    40
  • java servlet和jsp区别

    java servlet和jsp区别目前常见的动态网页技术有 CGI ASP PHP JSP 这几种 最早出现的技术是 CGI 通用网关接口 原先的 web 服务器并不支持动态的访问 即实时更新的网页内容 所以出现了 CGI 但是 CGI 运行效率低下 每次访问就会创建一个进程 访问结束就会关闭进程 这样给服务器带来了很大压力 所以 sun 公司就根据 javaapplet 设计出了 javaservlet 技术 javaservlet 是独立于平

    2026年3月16日
    2
  • MidJourney图像生成在品牌营销的应用

    MidJourney图像生成在品牌营销的应用

    2026年3月15日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号