去重是distinct还是group by？

全栈程序员-站长 • 2021年10月18日上午8:00 • 未分类 • 阅读 40

distinct简单来说就是用来去重的，而group by的设计目的则是用来聚合统计的，两者在能够实现的功能上有些相同之处，但应该仔细区分，因为用错场景的话，效率相差可以倍计。

单纯的去重操作使用distinct，速度是快于group by的。

distinct

distinct支持单列、多列的去重方式。
单列去重的方式简明易懂，即相同值只保留1个。
多列的去重则是根据指定的去重的列信息来进行，即只有所有指定的列信息都相同，才会被认为是重复的信息。

干巴巴的说不好理解，示例一下：

示例数据表中的数据：
mysql> select * from talk_test;
+----+-------+--------+
| id | name  | mobile |
+----+-------+--------+
|  1 | xiao9 | 555555 |
|  2 | xiao6 | 666666 |
|  3 | xiao9 | 888888 |
|  4 | xiao9 | 555555 |
|  5 | xiao6 | 777777 |
+----+-------+--------+

进行单列去重后的结果：
mysql> select distinct(name) from talk_test;
+-------+
| name  |
+-------+
| xiao9 |
| xiao6 |
+-------+
2 rows in set (0.01 sec)

mysql> select distinct(mobile) from talk_test;
+--------+
| mobile |
+--------+
| 555555 |
| 666666 |
| 888888 |
| 777777 |
+--------+
**只会保留指定的列的信息

进行多列去重后的结果：
mysql> select distinct name,mobile from talk_test;
+-------+--------+
| name  | mobile |
+-------+--------+
| xiao9 | 555555 |
| xiao6 | 666666 |
| xiao9 | 888888 |
| xiao6 | 777777 |
+-------+--------+
**只有所有指定的列信息都相同，才会被认定为重复的信息

group by使用的频率相对较高，但正如其功能一样，它的目的是用来进行聚合统计的，虽然也可能实现去重的功能，但这并不是它的长项。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/113442.html原文链接：https://javaforall.net

去重是distinct还是group by？

distinct

关于作者

全栈程序员-站长

发表回复

去重是distinct还是group by？

distinct

关于作者

全栈程序员-站长

相关推荐

php一键安装的环境包,php环境搭建的一键安装包有哪些？

uva 10555 – Dead Fraction)(数论)

renren-fast-vue项目结构解析

Android Bundle类

Java中finalize()方法的作用

轻松搞定！Trae 编程工具自定义ai 安装Cline 插件配置 Claude 3.7 API Key 教程

发表回复