mysql大数据量分页查询优化总结

mysql大数据量分页查询优化总结

大家好,又见面了,我是全栈君。

Mysql的分页查询十分简单,但是当数据量大的时候一般的分页就吃不消了。

传统分页查询:SELECT c1,c2,cn… FROM table LIMIT n,m

MySQL的limit工作原理就是先读取前面n条记录,然后抛弃前n条,读后面m条想要的,所以n越大,偏移量越大,性能就越差。

1)limit语句的查询时间与起始记录的位置成正比
2)mysql的limit语句是很方便,但是对记录很多的表并不适合直接使用。

推荐分页查询方法:

1、尽量给出查询的大致范围

利用表的覆盖索引来加速分页查询
我们都知道,利用了索引查询的语句中如果只包含了那个索引列(覆盖索引:索引的数据覆盖了需要查询的所有数据),那么这种情况会查询很快。
因为利用索引查找有优化算法,且数据就在查询索引上面,不用再去找相关的数据地址了,这样节省了很多时间。另外Mysql中也有相关的索引缓存,在并发高的时候利用缓存就效果更好了。
在我们的例子中,我们知道id字段是主键,自然就包含了默认的主键索引。现在让我们看看利用覆盖索引的查询效果如何:

之前,我们取最后一页记录的时间

select * from product limit 866613, 20   37.44秒

这次我们查询最后一页的数据(利用覆盖索引,只包含id列),如下:

select id from product limit 866613, 20 0.2秒

相对于查询了所有列的37.44秒,提升了大概100多倍的速度
那么如果我们也要查询所有列,有两种方法,一种是id>=的形式,另一种就是利用join,看下实际情况:

SELECT * FROM product WHERE ID > =(select id from product limit 866613, 1) limit 20
查询时间为0.2秒,简直是一个质的飞跃

另一种写法

SELECT * FROM product a JOIN (select id from product limit 866613, 20) b ON a.ID = b.id  

*统配符号在实际查询的中不应该使用,应该指明相应的属性,效率更好
其实两者用的都是一个原理,所以效果也差不多.

SELECT c1,c2,cn... FROM table WHERE id>=20000 LIMIT 10;

2、子查询法(在方法1基础上改进的)

SELECT c1,c2,cn... FROM table WHERE id>=
(
    SELECT id FROM table LIMIT 20000,1
)
LIMIT 10;

3、 第一步用用程序读取出ID,然后再用IN方法读取所需记录

程序读ID:

SELECT id FROM table LIMIT 20000, 10;
SELECT c1, c2, cn .. . FROM table WHERE id IN (id1, id2, idn.. .)

4.高性能MySQL一书中提到的只读索引方法(sql语句相比前三种复杂)

  一般表中经常作为条件查询的列都会建立索引,例如如下查询

    Sql代码  优化前

SELECT id, content  FROM tb_chat ORDER BY create_time DESC LIMIT 24000, 20;

Sql代码   优化后

SELECT id, content FROM tb_chat   
INNER JOIN (  
    SELECT id FROM tb_chat  
    ORDER BY create_time LIMIT 24000, 20  
    ) AS page USING(id);  

 这样当前查询页的内容就只会在索引中进行,当得到当前页的id再统一通过一个INNER JOIN得到最终要得到的数据详情,避免了对大量数据详情进行操作的消耗。当然JOIN操作也可以通过子查询实现,不过书中介绍5.6之前版本的mysql相比子查询还是优先使用JOIN。

对上一个sql继续优化改进,当有查询条件分页时,一定要确保有数据是在limit后面的条件里,正常有输入条件检索查询应该是limit 0, 10   我写的是limit 15000,20只是为了测试,因为符合该条件的数据只有1万5千多个,不然超出这个数就查不到数据了,切记。

SELECT id, content,c.z_type FROM tb_chat c
INNER JOIN (  
    SELECT id,z_type FROM tb_chat WHERE z_type='1'
    ORDER BY create_time LIMIT 15000, 20  
) AS page USING(id);  

等同于:

SELECT c.id, c.content,c.z_type FROM tb_chat c
INNER JOIN (  
    SELECT id,z_type FROM tb_chat WHERE z_type='1'
    ORDER BY create_time LIMIT 15000, 20  
) AS p ON c.id=p.id; 

个人觉得此方法更为通用,而且经过我的测试,发现表中总数据只有3万条数据时两个sql语句的执行时间竟然相差4倍,优化前的sql执行需要120ms,而优化后的sql需要30ms。

参考:https://www.cnblogs.com/shihaiming/p/6307018.html

https://blog.csdn.net/u011687186/article/details/70213024

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111503.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • navicat premium 15 mac 激活码【2021.8最新】

    (navicat premium 15 mac 激活码)这是一篇idea技术相关文章,由全栈君为大家提供,主要知识点是关于2021JetBrains全家桶永久激活码的内容IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.htmlS32PGH0SQB-eyJsa…

    2022年3月25日
    71
  • UFT12.02安装包

    UFT12.02安装包http://pan.baidu.com/s/1sjrz4gX

    2022年5月28日
    34
  • JS大数运算_大数阶乘运算

    JS大数运算_大数阶乘运算/***大数与或操作*/global.andorOpera=function(a,b,type){//type=1是与运算,type=2是或运算,默认是与运算a=a+””;b=b+””;varaStr=toBin(a);varbStr=toBi

    2022年10月7日
    1
  • C#实现QQ(高仿版)聊天窗口

    C#实现QQ(高仿版)聊天窗口一.编程思想(1).考虑聊天功能的实现,文本的获取以及显示;(2).窗体制作时需要的控件;(3).考虑是否可以发送空格以及空字符;(4).刚开始进入界面时焦点的位置;(5).获取输入内容鼠标光标跟踪最后一个字符处;(6).窗口抖动依赖位置的变化进行实现;(6).点击按钮对应的触发事件;二.代码的实现1.需要的控件简介:TextBox:允许用户输入文本,并提供多行编辑和密码字符掩……

    2022年7月24日
    8
  • 对于长沙互联网发展,一个外来两年Java程序员的所见所感所愿

    惟楚有材,于斯为盛本文有感于2019长沙互联网求职招聘大会,内容比较多,但都是我自己的一些所见、所感和所愿。2019年3月的最后一天,参加2019长沙互联网求职招聘大会,看到了很多的招聘企业,也看到了很多来求职的技术朋友们。金三银四,找工作的黄金时间,也是招聘的旺季!从去年开始,网上一直可以看到说互联网的寒冬来了,一些一线城市互联网公司的程序员们纷纷被“优化”,那么对于长沙来说,一个互联网…

    2022年2月28日
    114
  • Netty权威指南学习笔记

    Netty权威指南学习笔记最近花了一段时间系统的学习了Netty框架,包括《NettyinAction》以及《Netty权威指南》,对于博主自己来说,我觉得《Netty权威指南》要更适合博主。很厚的《Netty权威指南》权威指南,虽然上面一大部分是例子代码,当然有种跟着Netty官网学小demo的感觉。好记性不如烂笔头,所有代码均手抄Maven实现了一遍,所有例子均可运行,当然自己的学习笔记。Chapter2…

    2022年10月2日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号