Hive 时间日期处理总结

Hive 时间日期处理总结

最近用hive比较多,虽然效率低,但是由于都是T+1的业务模式。所以也就不要求太多了,够用就行。其中用的吧比较多就是时间了,由于大数据中很多字段都不是标准的时间类型字段,所以期间涉及了很多的时间日期字段的处理,这里做一个汇总。一遍以后查询使用。也方便大家学习。

下面列举几个用的比较多的情况进行说明:

获得当前日期的几种用法:

1.先来一个比较老的,select unix_timestamp() ;

结果如下:

1

2.通过提示可知该用法已经被放弃了建议采用current_timestamp来替代。查结果如下:

2

3.如果当前时间为int类型则需要转义一下比如使用from_unixtime()

SELECT from_unixtime(unix_timestamp());

--2018-02-27 14:51:01

 

4.获取当前日期CURRENT_DATE。代码如下:

SELECT CURRENT_DATE--2018-02-27

 

 

有关日期的函数:

1.对比日期函数,经常用于日期之间比较大小,或者计算差值,日期加减。

日期差值:datadiff(结束日期,开始日期),返回结束日期减去开始日期的天数。

日期加减:date_add(时间,增加天数),返回值为时间天+增加天的日期;date_sub(时间,减少天数),返回日期减少天后的日期。

执行情况如图所示:

3

  注意如果想知道相差多少个小时又怎么去求那?我们其实稍加改造即可。

  hour函数可以获得时间字段的小时数和datediff来获取两个日期相差的天数。然后利用天数*24+hour的差值即为所求,

  比如我们求2018-02-27 10:00:00 与 2018-02-25 12:00:00相差多少?

 实例代码如下:
select (hour('2018-02-27 10:00:00')-hour('2018-02-25 12:00:00')+(datediff('2018-02-27 10:00:00','2018-02-25 12:00:00'))*24) as hour_subValue

--46 

  补充一个:返回当前时间下再增加num_months个月的日期  add_months(string start_date, int num_months)

2.上面介绍了hour函数,那么我们也会需要其他的时间提取,不多说直接看代码,年月日时分秒:
select year('2018-02-27 10:00:00'),month('2018-02-27 10:00:00'),day('2018-02-27 10:00:00'),hour('2018-02-27 10:00:00'),minute('2018-02-27 10:00:00'),second('2018-02-27 10:00:00'),weekofyear('2018-02-27 10:00:00'); 

--2018    2    27    10    0    0    9

  补充:quarter,返回当前本年度第几个季度。

3.日期转换函数
to_date,语法: to_date(string timestamp),返回值为string类型的日期
示例如下:
select to_date('2018-02-27 10:03:01') ;

--2018-02-27
last_day(string date),返回这个月的最后一天的日期
select  last_day('2018-02-27 10:03:01');
--2018-02-28

 next_day返回当前时间的下一个星期几所对应的日期 。如下

select next_day('2018-02-27 10:03:01', 'TU');

--2018-03-06

  说明,输入日期为2-27,下个星期的周二为03-06,如果想要知道下周一的日期就是MO,周日就是SU,以此类推。

注意:

我跟无数多小白说过,西方国家周日是每周的第一天,所以日历和英语中都是现实周日再是周一,所以上面的下周日是3-4。注意喽!

总结

    以上是我平时经常用的一些日期相关的处理和函数,比较方便,想不起来就过来扫一眼。毕竟hive用的比较少,相对于关系型数据库的t-sql函数和方法还是比较low的,毕竟是个转义工具。
目前主流还是hivesql,不过慢慢的都在想sparksql之类技术的转移了。以后有新的日期函数我会继续想本文中进行汇总,方便大家查询。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119686.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • C++滑动窗口算法_最短连续包含子串

    C++滑动窗口算法_最短连续包含子串滑动窗口算法在一个特定大小的字符串或数组上进行操作,而不在整个字符串和数组上操作,这样就降低了问题的复杂度,从而也达到降低了循环的嵌套深度。如下题给你两个长度相同的字符串,s和t。将s中的第i个字符变到t中的第i个字符需要|s[i]-t[i]|的开销(开销可能为0),也就是两个字符的ASCII码值的差的绝对值。用于变更字符串的最大预算是maxCost。在转化字符串时,总开销应当小于等于该预算,这也意味着字符串的转化可能是不完全的。如果你可以将s的子字符串转

    2022年10月28日
    0
  • 卷积神经网络实现图像识别及过程可视化

    卷积神经网络实现图像识别及过程可视化卷积神经网络实现图像识别及过程可视化本博文提供经典的卷积神经网络实现代码,将CNN的工具类等代码分别封装,并提供接口自行替换使用的模型(可以换成自己的神经网络及图片样本),代码中提供模型保存和读取,并对卷积层的计算结果反卷积还原成图片输出到tensorboard中,最后可以在tensorboard中观察CNN训练的过程和结果数据,并查看过程中卷积核提取的具体特征。实验环…

    2022年6月8日
    29
  • Spring学习总结(一)入门

    Spring学习总结(一)入门

    2021年11月30日
    42
  • group by 和 order by 的区别 + 理解过程

    group by 和 order by 的区别 + 理解过程orderby和groupby的区别order by 和 group by 的区别:1,order by 从英文里理解就是行的排序方式,默认的为升序。 order by 后面必须列出排序的字段名,可以是多个字段名。2,group by 从英文里理解就是分组。必须有“聚合函数”来配合才能使用,使用时至少需要一个分组标志字段。注意:聚合函数是—sum()、count()、…

    2022年5月9日
    37
  • QQ图片文件夹说明及清理

    QQ图片文件夹说明及清理C2C(个人与好友之间的图片传输,清空与否依照个人意愿)Group(群组之间的图片传输,很乱建议全部清空)MarktingMsgCachePic(Markting+Msg+Cache+Pic意思是消息图片缓冲集合,就是你聊天时候发送的一些图片保存的地方,无用,可删除)MsgWander(漫游信息,浏览信息,可删)SharePic(分享图片,可删)*注意不要删掉文件夹(比如SharePic)要打开选

    2022年8月10日
    5
  • 数据库系统及应用实验与课程设计指导(图书管理系统c++课程设计)

    一、系统平台开发工具:EclipsejavaMars数据库MySQLserver,Navicat可视化工具操作系统:win10百度云链接:https://pan.baidu.com/s/1SIWR75NRIh8sSL0oV7uZgA提取码:4y44二、数据库规划1.任务陈述:图书馆信息管理系统数据库用以收集、存储书籍信息、人员(读者、图书管理员…

    2022年4月18日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号