mysql分组后,取每组第一条数据或最新一条

mysql分组后,取每组第一条数据或最新一条环境 MySQL 5 7Java 1 8SQL 语句的写法 select from selectdistin a id tid a fromtemplate detailawhere template idin 3 4 orderbya iddesc ttgroupbytt template id 思路 先进行排序 然后再进行分组 获取每组的第一条 Q 为什么要写 distinct a i

环境

SQL语句的写法:

select * from (select distinct(a.id) tid, a.* from template_detail a where a.template_id in (3, 4) order by a.id desc) tt group by tt.template_id; 

思路:先进行排序,然后再进行分组,获取每组的第一条。

通过子查询中的order by a.id desc就可以做到是每组最新一条,还是第一条。
通过实践,我们知道这种查询方式,与分组子查询相比性能慢了些,慢一点点

-- 这种查询方式更快一丢丢 SELECT bb.`detail`, bb.`id`,bb.`template_id` from `template_detail` bb INNER JOIN ( SELECT MAX(`id`) id, `template_id` from `template_detail` GROUP BY `template_id` ) as tb on bb.`id` = tb.id 

Q: 为什么要写distinct(a.id)呢?
A:防止合并的构造(derived_merge);

什么是derived_merge?

derived_merge指的是一种查询优化技术,作用就是把派生表合并到外部的查询中,提高数据检索的效率。这个特性在MySQL5.7版本中被引入,可以通过如下SQL语句进行查看/开启/关闭等操作。

上面虽然听起来感觉很牛逼的样子,但是实际情况是,这个新特性,不怎么受欢迎,容易引起错误。

可以在子查询中使用以下函数来进行关闭这个特性:

可以通过在子查询中使用任何阻止合并的构造来禁用合并,尽管这些构造对实现的影响并不明确。 防止合并的构造对于派生表和视图引用是相同的: 1.聚合函数( SUM()MIN()MAX()COUNT()等) 2.DISTINCT 3.GROUP BY 4.HAVING 5.LIMIT 6.UNION或UNION ALL 7.选择列表中的子查询 8.分配给用户变量 9.仅引用文字值(在这种情况下,没有基础表) 

子查询order by失效的场景

select * from (select a.* from template_detail a where a.template_id in (3, 4) order by a.id desc) tt group by tt.template_id; 

假设我们现在把distinct(a.id) tid, 去掉,会发现子查询(或者叫:临时表)中的order by a.id desc失效了。
为什么会这样呢?

原理分析:

我们这里使用了临时表排序,继而对其结果进行分组,结果显示失败,加了distinct(a.id) tid, 后结果正确,原因是因为临时表(派生表derived table)中使用order by且使其生效,必须满足三个条件:

  1. 外部查询禁止分组或者聚合
  2. 外部查询未指定having,HAVING, order by
  3. 外部查询将派生表或者视图作为from句中唯一指定源

不满足这三个条件,order by会被忽略。

一旦外部表使用了group by,那么临时表(派生表 derived table)将不会执行filesort操作(即order by 会被忽略),所以我在临时表中加了(distinct(a.id))。
加了之后就相当于关闭了该特性,所以也就生效了。

参考地址:

https://dev.mysql.com/doc/refman/5.7/en/derived-table-optimization.html

分组查询取每组最新的数据(order by 和group by使用问题)

mysql分组后获取每个组排序后的第一条数据(整行)

Mysql取分组后的每组第一条数据

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/231755.html原文链接:https://javaforall.net

(0)
上一篇 2025年11月23日 下午8:01
下一篇 2025年11月23日 下午8:22


相关推荐

  • python中modulenotfounderror_esxi安装报错

    python中modulenotfounderror_esxi安装报错1.下载安装包https://www.python.org/ftp/python/该目录下选择所需要的版本进行下载、解压。wgethttps://www.python.org/ftp/python/3.7.1/Python-3.7.1.tgztar-xzvfPython-3.7.1.tgz2.二进制文件安装  1.创建存放目录mkdir/usr/l…

    2025年12月1日
    6
  • php二次开发知识,Discuz二次开发基本知识详细讲解

    php二次开发知识,Discuz二次开发基本知识详细讲解Discuz是国内最流行的论坛软件管理系统,今天小编跟大家分享一篇关于Discuz二次开发基本知识详细讲解,感兴趣的朋友跟小编一起来了解一下吧!一)Discuz!的文件系统目录注:想搞DZ开发,就得弄懂DZ中每个文件的功能。a)Admin:后台管理功能模块b)Api:DZ系统与其它系统之间接口程序c)Archiver:DZ中,用以搜索引擎优化的无图版d)Attachments:DZ中,…

    2022年5月12日
    45
  • git命令大全(非常齐全)[通俗易懂]

    git命令大全(非常齐全)[通俗易懂]git命令大全

    2022年7月14日
    17
  • 一个好玩的小游戏(纯C语言编写)

    一个好玩的小游戏(纯C语言编写)最近在看知乎是发现了一个这一个专栏https://zhuanlan.zhihu.com/c2game从中获取的许多知识,本文中的游戏也是从里面学到的,不过本人又自己加了一些功能。这是一个类似于飞机大战的游戏,不过目前代码量比较小,所以看起来非常简陋游戏界面如下更新日志,本人将原来的原来的代码有进一步的优化了一下,之前是只有一个非常小的战机现在更新后可以产生一个非常大的战机(看起来也更

    2022年5月19日
    46
  • 时间戳格式化「建议收藏」

    时间戳格式化「建议收藏」须知:1. 时间戳分2种,一种是10位的,只包含年月日时分秒,也就是说,只精确到秒。一种是13位的,包含毫秒。这2种都叫时间戳,并不是只有精确到毫秒的才叫时间戳。10位时间戳就是从1970-01-01到当前的秒数,注意,不是毫秒数,所以需要按毫秒解析时,要*100013位时间戳就是从1970-01-01到当前的毫秒数,在java中用Instant对象对应。2. timestamp的格式化串用大写的S来表示毫秒数。S的个数和毫秒的位数严格对应,否则报错。如果规范中要求精确到毫秒,那么给的时间字符串

    2022年4月19日
    474

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号