SQL 聚合函数之字符串分组合并[通俗易懂]

SQL 聚合函数之字符串分组合并[通俗易懂]本文介绍了如何通过SQL函数对字符串进行聚合,也就是将多行字符串合并成单个字符串。包括Oracle(LISTAGG函数)、MySQL(GROUP_CONCAT函数)、SQLServer(STRING_AGG函数)、PostgreSQL(STRING_AGG函数)以及SQLite(GROUP_CONCAT函数)的语法和差异。

大家好,又见面了,我是你们的朋友全栈君。

大家好,我是只谈技术不剪发的 Tony 老师。

SQL 聚合函数(Aggregate Function)可以对一组数据进行汇总并返回单个结果。我们常见的聚合函数有 COUNT、AVG、SUM 等。今天给大家介绍一下如何通过 SQL 函数对字符串进行聚合,也就是将多行字符串合并成单个字符串。本文涉及的数据库包括 Oracle、MySQL、SQL Server、PostgreSQL 以及 SQLite。

如果觉得文章有用,欢迎评论?、点赞?、推荐?

Oracle 中的 LISTAGG 函数

Oracle 实现了 SQL:2016 标准中的 LISTAGG 函数,例如(示例数据)以下查询返回了每个部门中的员工:

SELECT dept_id, LISTAGG(emp_name, ';') 
FROM employee
GROUP BY dept_id;

DEPT_ID|LISTAGG(EMP_NAME,';')                    |
-------|-----------------------------------------|
      1|刘备;关羽;张飞                            |
      2|诸葛亮;黄忠;魏延                          |
      3|孙尚香;孙丫鬟                             |
      4|赵云;廖化;关平;赵氏;关兴;张苞;赵统;周仓;马岱|
      5|法正;庞统;蒋琬;黄权;糜竺;邓芝;简雍;孙乾    |

查询将每个部门中的多个员工姓名合并成了一行数据,多个姓名之间使用分号进行分隔。

如果想要在合并之前将员工进行排序,可以使用 WITHIN GROUP 选项。例如:

SELECT dept_id, LISTAGG(emp_name, ';') WITHIN GROUP (ORDER BY hire_date, salary DESC)
FROM employee
GROUP BY dept_id;

DEPT_ID|LISTAGG(EMP_NAME,';')WITHINGROUP(ORDERBYHIRE_DATE,SALARYDESC)              |
-------|---------------------------------------------------------------------------|
      1|刘备;关羽;张飞                                                              |
      2|诸葛亮;魏延;黄忠                                                            |
      3|孙尚香;孙丫鬟                                                               |
      4|赵云;廖化;周仓;关平;关兴;赵氏;赵统;张苞;马岱                                  |
      5|法正;庞统;蒋琬;黄权;糜竺;孙乾;邓芝;简雍                                      |

对于每个部门中的员工,首先按照入职日期进行排序,入职日期相同再按照月薪从高到低进行排序,然后将员工姓名进行合并。

除此之外,LISTAGG 函数还支持一些其他选项,完整的语法如下:

LISTAGG( [ ALL ] [ DISTINCT ] measure_expr [, 'delimiter'] [listagg_overflow_clause] )
  [ WITHIN GROUP ] (order_by_clause) [OVER query_partition_clause]

listagg_overflow_clause::=
{ ON OVERFLOW ERROR }
|
{ ON OVERFLOW TRUNCATE [ 'truncation-indicator' ] [ { WITH | WITHOUT } COUNT ] }

其中,DISTINCT 表示排除每个分组中的重复数据,ALL(默认值)表示使用全部数据;默认的分隔符为 NULL;listagg_overflow_clause 用于处理合并结果超长的情况,ON OVERFLOW ERROR(默认值)表示超长时返回错误,ON OVERFLOW TRUNCATE 表示超长时截断字符串;OVER 子句表示将该函数当作分析函数使用。

LISTAGG 函数忽略输入参数中的空值。如果想要了解 LISTAGG 函数的更多用法,可以参考 Oracle 官方文档

MySQL 中的 GROUP_CONCAT 函数

MySQL 提供了聚合字符串的 GROUP_CONCAT 函数,例如以下查询返回了每个部门中的员工:

SELECT dept_id, GROUP_CONCAT(emp_name SEPARATOR ';')
FROM employee
GROUP BY dept_id;

dept_id|GROUP_CONCAT(emp_name SEPARATOR ';')               |
-------|---------------------------------------------------|
      1|刘备;关羽;张飞                                      |
      2|诸葛亮;黄忠;魏延                                    |
      3|孙尚香;孙丫鬟                                       |
      4|赵云;廖化;关平;赵氏;关兴;张苞;赵统;周仓;马岱          |
      5|法正;庞统;蒋琬;黄权;糜竺;邓芝;简雍;孙乾              |

查询将每个部门中的多个员工姓名合并成了一行数据,多个姓名之间使用分号进行分隔。

如果想要在合并之前将员工进行排序,可以使用 ORDER BY 选项。例如:

SELECT dept_id, GROUP_CONCAT(emp_name ORDER BY hire_date, salary DESC SEPARATOR ';')
FROM employee
GROUP BY dept_id;

dept_id|GROUP_CONCAT(emp_name ORDER BY hire_date, salary DESC SEPARATOR ';')|
-------|--------------------------------------------------------------------|
      1|刘备;关羽;张飞                                                       |
      2|诸葛亮;魏延;黄忠                                                     |
      3|孙尚香;孙丫鬟                                                        |
      4|赵云;廖化;周仓;关平;关兴;赵氏;赵统;张苞;马岱                          |
      5|法正;庞统;蒋琬;黄权;糜竺;孙乾;邓芝;简雍                               |

对于每个部门中的员工,首先按照入职日期进行排序,入职日期相同再按照月薪从高到低进行排序,然后将员工姓名进行合并。

除此之外,GROUP_CONCAT 函数还支持一些其他选项,完整的语法如下:

GROUP_CONCAT([DISTINCT] expr [,expr ...]
             [ORDER BY {unsigned_integer | col_name | expr} [ASC | DESC] [,col_name ...]]
             [SEPARATOR str_val])

其中,DISTINCT 表示排除每个分组中的重复数据,默认表示使用全部数据;ORDER BY 表示聚合之前先排序;SEPARATOR 子句表用于指定分隔符,默认为逗号。

GROUP_CONCAT 函数忽略输入参数中的空值。如果 GROUP_CONCAT 函数返回的结果超过系统变量 group_concat_max_len 设置的长度,将会截断合并后的字符串。更多信息可以参考 MySQL 官方文档

SQL Server 中的 STRING_AGG 函数

SQL Server 2017 提供了字符串聚合函数:STRING_AGG。例如,以下查询返回了每个部门中的员工:

SELECT dept_id, STRING_AGG(emp_name, ';')
FROM employee
GROUP BY dept_id;

dept_id|                                         |
-------|-----------------------------------------|
      1|刘备;关羽;张飞                            |
      2|诸葛亮;黄忠;魏延                          |
      3|孙尚香;孙丫鬟                             |
      4|赵云;廖化;关平;赵氏;关兴;张苞;赵统;周仓;马岱|
      5|法正;庞统;蒋琬;黄权;糜竺;邓芝;简雍;孙乾     |

查询将每个部门中的多个员工姓名合并成了一行数据,多个姓名之间使用分号进行分隔。

如果想要在合并之前将员工进行排序,可以使用 WITHIN GROUP 选项。例如:

SELECT dept_id, STRING_AGG(emp_name, ';') WITHIN GROUP (ORDER BY hire_date, salary DESC)
FROM employee
GROUP BY dept_id;

dept_id|                                         |
-------|-----------------------------------------|
      1|刘备;关羽;张飞                            |
      2|诸葛亮;魏延;黄忠                          |
      3|孙尚香;孙丫鬟                             |
      4|赵云;廖化;周仓;关平;关兴;赵氏;赵统;张苞;马岱|
      5|法正;庞统;蒋琬;黄权;糜竺;孙乾;邓芝;简雍     |

对于每个部门中的员工,首先按照入职日期进行排序,入职日期相同再按照月薪从高到低进行排序,然后将员工姓名进行合并。

STRING_AGG 函数的完整语法如下:

STRING_AGG ( expression, separator ) [ <order_clause> ]

<order_clause> ::=   
    WITHIN GROUP ( ORDER BY <order_by_expression_list> [ ASC | DESC ] )

STRING_AGG 函数忽略输入参数中的空值。如果想要了解 STRING_AGG 函数的更多用法,可以参考 SQL Server 官方文档

PostgreSQL 中的 STRING_AGG 函数

PostgreSQL 实现了字符串聚合的 STRING_AGG 函数。例如,以下查询返回了每个部门中的员工:

SELECT dept_id, STRING_AGG(emp_name, ';')
FROM employee
GROUP BY dept_id;

dept_id|string_agg                               |
-------|-----------------------------------------|
      4|赵云;廖化;关平;赵氏;关兴;张苞;赵统;周仓;马岱|
      2|诸葛亮;黄忠;魏延                          |
      3|孙尚香;孙丫鬟                             |
      1|刘备;关羽;张飞                            |
      5|法正;庞统;蒋琬;黄权;糜竺;邓芝;简雍;孙乾     |

查询将每个部门中的多个员工姓名合并成了一行数据,多个姓名之间使用分号进行分隔。

如果想要在合并之前将员工进行排序,可以使用 ORDER BY 选项。例如:

SELECT dept_id, STRING_AGG(emp_name, ';' ORDER BY hire_date, salary DESC)
FROM employee
GROUP BY dept_id;

dept_id|string_agg                               |
-------|-----------------------------------------|
      1|刘备;关羽;张飞                            |
      2|诸葛亮;魏延;黄忠                          |
      3|孙尚香;孙丫鬟                             |
      4|赵云;廖化;周仓;关平;关兴;赵氏;赵统;张苞;马岱|
      5|法正;庞统;蒋琬;黄权;糜竺;孙乾;邓芝;简雍     |

对于每个部门中的员工,首先按照入职日期进行排序,入职日期相同再按照月薪从高到低进行排序,然后将员工姓名进行合并。

STRING_AGG 函数的完整语法如下:

STRING_AGG ( [ALL|DISTINCT] expression, separator [ORDER BY]) [ FILTER ( WHERE filter_clause ) ]

其中,DISTINCT 表示排除每个分组中的重复数据,ALL(默认值)表示使用全部数据;FILTER 子句用于指定一个过滤条件,只有满足条件的数据才会进行聚合。STRING_AGG 函数忽略输入参数中的空值。

关于聚合函数的详细介绍,可以参考 PostgreSQL 官方文档

SQLite 中的 GROUP_CONCAT 函数

SQLite 提供了实现字符串聚合的GROUP_CONCAT 函数。例如,以下查询返回了每个部门中的员工:

SELECT dept_id, GROUP_CONCAT(emp_name, ';')
FROM employee
GROUP BY dept_id;

dept_id|GROUP_CONCAT(emp_name, ';')               |
-------|------------------------------------------|
      1|刘备;关羽;张飞                             |
      2|诸葛亮;黄忠;魏延                           |
      3|孙尚香;孙丫鬟                              |
      4|赵云;廖化;关平;赵氏;关兴;张苞;赵统;周仓;马岱 |
      5|法正;庞统;蒋琬;黄权;糜竺;邓芝;简雍;孙乾     |

查询将每个部门中的多个员工姓名合并成了一行数据,多个姓名之间使用分号进行分隔。

如果不指定分隔符,GROUP_CONCAT 函数默认使用逗号进行分隔。GROUP_CONCAT 函数忽略输入参数中的空值。同时,该函数不支持分组内的数据排序,按照随意顺序进行字符串合并。

总结

本文介绍了 5 种主流数据库中的字符串聚合函数,使用时需要注意不同数据库中的参数差异。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/151853.html原文链接:https://javaforall.net

(1)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • origin带误差线的柱状图_怎么加误差棒

    origin带误差线的柱状图_怎么加误差棒软件版本:OriginPro2021b(64-bit)SR29.8.5.212(学习版)本期目标:接下来,正文开始:1,如图1,数据包含三个类型的数据列(X轴/Y轴/误差列)。A列表示X轴分组,B/D/F/H列表示Y轴数据,C/E/G/I列表示误差数据(此处为标准差)。注:此处数据设置为关键,需要按照正确,后面才可以绘制带有误差棒的分组柱状图。图1数据设置2,按照上图方式输入数据后,选中数据后,点击菜单栏——绘图——类别——多因子组柱状图-索引数据进行图形绘制,如图

    2022年9月29日
    3
  • C#实现局域网文件传输

    C#实现局域网文件传输网络通信一般都是通过Socket进行的,称为进程通信机制,通常也称作”套接字”,用于描述IP地址和端口,是一个通信链的句柄。先学习一下socket基本原理:socket原理:  在Internet上有很多这样的主机,这些主机一般运行了多个服务软件,同时提供几种服务。每种服务都打开一个Socket,并绑定到一个端口上,不同的端口对应于不同的服务。Socket正如其英文原意那样,象一个多孔插…

    2022年5月22日
    276
  • 微信朋友圈自动点赞

    微信朋友圈自动点赞我一直都不太喜欢给别人点赞,某一年(貌似是17年)微信出了一次朋友圈年报,那一整年我就点出去了几个赞,要知道当时我微信好友应该有300+。我觉得这是我不喜欢参与社交活动在网络世界的一种体现吧。不给被人点赞也没啥坏处,但你不评不赞,难免会让你和好友之间有些疏远,给别人点赞吧我又嫌麻烦,于是一直想着做个自动点赞的东西,今天基本实现了,虽然诸多不完整和诸多限制,但还是决定分享出来,主要是我觉得还挺好玩的…

    2022年6月11日
    39
  • origin如何绘制双y轴柱状图_Graphpad柱状图双Y轴

    origin如何绘制双y轴柱状图_Graphpad柱状图双Y轴origin横坐标的标注如何修改成双行显示呢?shift+enter,可以换行思路:在两个图层上分别绘制两个柱状图,然后将两个图层合并。第一步:建立一个X列,四个Y列。其中,两列数据中间加上两个空列第二步:绘制第一个柱状图第三步:绘制第二个柱状图第四步:两图层合并点击合并按钮第五步:接下来就是坐标轴的显示基本上就完成了…

    2022年9月30日
    4
  • ArcGIS Engine中的Symbols详解

    ArcGIS Engine中的Symbols详解

    2022年3月11日
    32
  • idea查看激活码(在线激活)

    idea查看激活码(在线激活),https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月14日
    282

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号