hive sql语句和mysql用法区别存档

hive sql语句和mysql用法区别存档写在前面以下功能版本:mysql版本:5.6.17hive版本:2.2.41、GROUP_CONCAT先看下面数据表test_group:(1)简单情况需求如下:写出一个sql语句,按照category分组,并把组内的name使用“;”分隔符连接。①mysql中SELECT category, GROUP_CONCAT(nameSEPARATOR";&quo

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

写在前面

mysql和hive版本:
mysql版本:5.6.17
hive版本:2.1.1

一、GROUP_CONCAT功能

本功能测试基于以下数据表test_group:


hive sql语句和mysql用法区别存档

1、简单功能实现对比

需求如下: 写出一个sql语句,按照category分组,并把组内的name使用“; ”分隔符连接。

(1)mysql中
SELECT 
	category, 
	GROUP_CONCAT(name SEPARATOR "; ")   # SEPARATOR后面是分隔符
FROM 
	test_group 
GROUP BY 
	category 

结果如下:


hive sql语句和mysql用法区别存档

GROUP_CONCAT()函数的API如下:

功能: 将group by产生的同一个分组中的值连接起来,返回一个字符串结果。
语法: group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator ‘分隔符’] )
说明: 通过使用distinct可以排除重复值;如果希望对结果中的值进行排序,可以使用order by子句;separator是一个字符串值,缺省为一个逗号。

(2)hive中

hive不提供GROUP_CONCAT函数,所以需要使用其他方法代替,我们可以使用CONCAT_WS()函数代替,如下:

SELECT 
	category, 
	CONCAT_WS("\; ", COLLECT_LIST(name)) 
FROM 
	test_group 
GROUP BY 
	category     

输出结果如下:
在这里插入图片描述

注意: COLLECT_LIST表示组内不去重,COLLECT_SET表示组内去重,表示将name字段放到一个list/set中,在使用concat_ws进行连接。

2、组内排序下的GROUP_CONCAT对比

需求如下: 写出一个sql语句,按照category分组,并把组内的name和level使用“name-level”格式使用“; ”分隔符连接,并在组内使用level降序排列。

①mysql中
SELECT 
	category, 
	GROUP_CONCAT(CONCAT(name, '-', level) ORDER BY level DESC SEPARATOR "; ") as res    # ORDER BY level DESC表示组内排序
FROM 
	test_group 
GROUP BY 
	category 

输出结果如下:


hive sql语句和mysql用法区别存档

(2)hive中
SELECT 
	temp.category, 
	CONCAT_WS("\; ", COLLECT_LIST(CONCAT(tmp.name, '-', tmp.level)))  as res  # CONCAT(tmp.name, '-', tmp.level)表示将name字段和level字段使用‘-’连接
FROM 
	(
		SELECT * FROM test_group  ORDER BY level DESC
	) tmp 
GROUP BY 
	tmp.category 

结果如下:
在这里插入图片描述

二、字符串的split功能

1、hive中

在hive中,直接提供split函数,使用如下:

hive> select split("1,2,3", ',');     # 返回结果:
hive> select split("1,2,3", ',')[0];   # 返回结果:1
hive> select split("1,2,3", ',')[1];   # 返回结果:2
hive> select split("1,2,3", ',')[2];   # 返回结果:3

2、mysql中

mysql没有提供split函数,但是可以使用substring函数达到类似的效果。举例如下:

mysql> select substring_index("1,2,3",",",1);    # 返回结果:1
mysql> select substring_index("1,2,3",",",2);    # 返回结果:1,2
mysql> select substring_index("1,2,3",",",3);    # 返回结果:1,2,3
mysql> select substring_index("1,2,3",",",-1);   # 返回结果:3
mysql> select substring_index("1,2,3",",",-2);   # 返回结果:2,3
mysql> select substring_index("1,2,3",",",-3);   # 返回结果:1,2,3

负号表示反向取数,和py中功能一样。

但是如果我们想把2提取出来,该怎么做?用2个substring(),举例如下:

mysql> SELECT substring_index(substring_index("1,2,3",',',2),',',-1)    # 返回结果:2
mysql> SELECT substring_index(substring_index("1,2,3",',',-2),',',1)    # 返回结果:2
mysql> SELECT substring_index(substring_index("1,2,3",',',3),',',-1)    # 返回结果:3
mysql> SELECT substring_index(substring_index("1,2,3",',',-2),',',-1)   # 返回结果:3

三、row_number、rank和dense_rank()

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/186840.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • DNS负载均衡 例子

    DNS负载均衡 例子在host文件中加入192.168.8.240 centos1and2192.168.8.204 centos1and2完成。

    2022年7月14日
    15
  • nactive15激活码(破解版激活)

    nactive15激活码(破解版激活),https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月15日
    54
  • Android蓝牙开发教程(一)——搜索蓝牙设备[通俗易懂]

    Android蓝牙开发教程(一)——搜索蓝牙设备[通俗易懂]Android蓝牙功能的开发一直是很多新手头疼的问题,网上虽然也有很多教程贴,但大多都写得不全面,不能让我们真正掌握蓝牙开发的基本知识。本教程主要讲解搜索蓝牙设备、蓝牙设备之间的连接和蓝牙之间的通讯三个主要模块。掌握了这三个,基本就能进行简单的蓝牙开发了。先上效果图界面比较简单。主要有三个按钮,两个文本和一个列表。三个按钮主要对应打开蓝牙,搜索设备和发送信息三个功能。两个文本主…

    2022年7月15日
    26
  • WebSocket断线自动重连javascript库(含心跳包)

    WebSocket断线自动重连javascript库(含心跳包)ReconnectingWebSocket是一个小型的JavaScript库,封装了WebSocketAPI提供了在连接断开时自动重连的机制。//只需要简单的将:varws=newWebSocket(‘ws://….’);//替换成:varws=newReconnectingWebSocket(‘ws://….’);原ReconnectingWebSocket的GITHUB下载地址下面是我从ReconnectingWebSocket源代码里根据我自身.

    2022年7月18日
    22
  • keras 双向LSTM 简单示例[通俗易懂]

    keras 双向LSTM 简单示例[通俗易懂]importtensorflow.compat.v1astffromkeras.layersimportConvLSTM2D,TimeDistributed,Conv2D,Bidirectionalimportnumpyasnpinputs_np=tf.convert_to_tensor(np.random.random((4,6,256,256,3)).astype(np.float32))#shape=[5,6,10,10,3]conv1=TimeDi.

    2022年6月21日
    37
  • Python获取时间戳_Python中文当前时间

    Python获取时间戳_Python中文当前时间原博文2019-01-0410:42−#!/usr/bin/python#-*-coding:UTF-8-*-importtime;#引入time模块ticks=time.time()print(“当前时间戳为:”,ticks)输出:当前时间戳为:1459994552.51&nbsp…相关推荐2019-12-0610:29−1.获取当前时间的时间…

    2022年10月2日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号