hive sql语句和mysql用法区别存档

hive sql语句和mysql用法区别存档写在前面以下功能版本:mysql版本:5.6.17hive版本:2.2.41、GROUP_CONCAT先看下面数据表test_group:(1)简单情况需求如下:写出一个sql语句,按照category分组,并把组内的name使用“;”分隔符连接。①mysql中SELECT category, GROUP_CONCAT(nameSEPARATOR";&quo

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

写在前面

mysql和hive版本:
mysql版本:5.6.17
hive版本:2.1.1

一、GROUP_CONCAT功能

本功能测试基于以下数据表test_group:


hive sql语句和mysql用法区别存档

1、简单功能实现对比

需求如下: 写出一个sql语句,按照category分组,并把组内的name使用“; ”分隔符连接。

(1)mysql中
SELECT 
	category, 
	GROUP_CONCAT(name SEPARATOR "; ")   # SEPARATOR后面是分隔符
FROM 
	test_group 
GROUP BY 
	category 

结果如下:


hive sql语句和mysql用法区别存档

GROUP_CONCAT()函数的API如下:

功能: 将group by产生的同一个分组中的值连接起来,返回一个字符串结果。
语法: group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator ‘分隔符’] )
说明: 通过使用distinct可以排除重复值;如果希望对结果中的值进行排序,可以使用order by子句;separator是一个字符串值,缺省为一个逗号。

(2)hive中

hive不提供GROUP_CONCAT函数,所以需要使用其他方法代替,我们可以使用CONCAT_WS()函数代替,如下:

SELECT 
	category, 
	CONCAT_WS("\; ", COLLECT_LIST(name)) 
FROM 
	test_group 
GROUP BY 
	category     

输出结果如下:
在这里插入图片描述

注意: COLLECT_LIST表示组内不去重,COLLECT_SET表示组内去重,表示将name字段放到一个list/set中,在使用concat_ws进行连接。

2、组内排序下的GROUP_CONCAT对比

需求如下: 写出一个sql语句,按照category分组,并把组内的name和level使用“name-level”格式使用“; ”分隔符连接,并在组内使用level降序排列。

①mysql中
SELECT 
	category, 
	GROUP_CONCAT(CONCAT(name, '-', level) ORDER BY level DESC SEPARATOR "; ") as res    # ORDER BY level DESC表示组内排序
FROM 
	test_group 
GROUP BY 
	category 

输出结果如下:


hive sql语句和mysql用法区别存档

(2)hive中
SELECT 
	temp.category, 
	CONCAT_WS("\; ", COLLECT_LIST(CONCAT(tmp.name, '-', tmp.level)))  as res  # CONCAT(tmp.name, '-', tmp.level)表示将name字段和level字段使用‘-’连接
FROM 
	(
		SELECT * FROM test_group  ORDER BY level DESC
	) tmp 
GROUP BY 
	tmp.category 

结果如下:
在这里插入图片描述

二、字符串的split功能

1、hive中

在hive中,直接提供split函数,使用如下:

hive> select split("1,2,3", ',');     # 返回结果:
hive> select split("1,2,3", ',')[0];   # 返回结果:1
hive> select split("1,2,3", ',')[1];   # 返回结果:2
hive> select split("1,2,3", ',')[2];   # 返回结果:3

2、mysql中

mysql没有提供split函数,但是可以使用substring函数达到类似的效果。举例如下:

mysql> select substring_index("1,2,3",",",1);    # 返回结果:1
mysql> select substring_index("1,2,3",",",2);    # 返回结果:1,2
mysql> select substring_index("1,2,3",",",3);    # 返回结果:1,2,3
mysql> select substring_index("1,2,3",",",-1);   # 返回结果:3
mysql> select substring_index("1,2,3",",",-2);   # 返回结果:2,3
mysql> select substring_index("1,2,3",",",-3);   # 返回结果:1,2,3

负号表示反向取数,和py中功能一样。

但是如果我们想把2提取出来,该怎么做?用2个substring(),举例如下:

mysql> SELECT substring_index(substring_index("1,2,3",',',2),',',-1)    # 返回结果:2
mysql> SELECT substring_index(substring_index("1,2,3",',',-2),',',1)    # 返回结果:2
mysql> SELECT substring_index(substring_index("1,2,3",',',3),',',-1)    # 返回结果:3
mysql> SELECT substring_index(substring_index("1,2,3",',',-2),',',-1)   # 返回结果:3

三、row_number、rank和dense_rank()

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/186840.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • jquery——zTree, 完美好用的树插件

    jquery——zTree, 完美好用的树插件

    2021年11月30日
    42
  • 深度学习100例-循环神经网络(LSTM)实现股票预测 | 第10天

    深度学习100例-循环神经网络(LSTM)实现股票预测 | 第10天文章目录一、前言二、LSTM的是什么三、准备工作1.设置GPU2.设置相关参数3.加载数据四、数据预处理1.归一化2.时间戳函数五、构建模型六、激活模型七、训练模型八、结果可视化1.绘制loss图2.预测3.评估一、前言今天是第10天,我们将使用LSTM完成股票开盘价格的预测,最后的R2可达到0.74,相对传统的RNN的0.72提高了两个百分点。我的环境:语言环境:Python3.6.5编译器:jupyternotebook深度学习环境:TensorFlow2.4.1来自专栏:【深度学习

    2022年6月16日
    28
  • 双向链表排序[通俗易懂]

    双向链表排序[通俗易懂]双向链表的结构体,包括一个前驱节点的指针、一个后继节点的指针以及一个存储数据的data域,initList函数初始化单节点的双链表,addList函数采用头插入方法添加一个节点到双链表中,sort函数实现了对双链表的排序,采用头插入方式建成的双链表的头结点(存储65535的那个节点)必然在末尾(其实双链表没有首尾之说,只是把它当作末尾),排序的时候,1.首先从该节点处,每次查找前驱节点,并记录da…

    2022年10月11日
    4
  • 信号处理中包络是什么意思_重庆邮电大学复试通信原理

    信号处理中包络是什么意思_重庆邮电大学复试通信原理第一章绪论1.基带信号的定义基带信号是指信号的频谱从零频附近开始的,没有经过调制的信号2.什么是数字信号和模拟信号?二者的区别是什么?数字信号是信号参量的取值是离散的,模拟信号是信号参量的取值是连续的。区别是信号参量的取值是连续还是离散。3.什么是数字通信?描述数字通信系统的主要优缺点?数字通信就是用数字信号传输信息的通信系统。数字通信系统的优点有差错可控,抗干扰能力强,易于存储,处理和…

    2022年8月10日
    7
  • nginx基本配置「建议收藏」

    nginx基本配置「建议收藏」Nginx概念Nginx是一个高性能的HTTP和反向代理服务。其特点是占有内存少,并发能力强,事实上nginx的并发能力在同类型的网页服务器中表现较好。Nginx专为性能优化而开发,性能是

    2022年7月1日
    24
  • vue生命周期钩子函数(详解及使用场景)(什么是vue的生命周期)

    vue中生命周期钩子函数有哪些发布时间:2020-12-0713:07:03来源:亿速云阅读:94作者:小新这篇文章主要介绍vue中生命周期钩子函数有哪些,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!Vue实例的生命周期钩子函数(8个)1、beforeCreate刚new了一个组件,无法访问到数据和真实的dom,基本上这个好像不能干啥2、createddata属性完成了…

    2022年4月12日
    154

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号