Hive系列 (六):Hive数据类型转换

Hive系列 (六):Hive数据类型转换hive 数据类型转换规则及转换原则 日期类型转换

Hive系列文章

Hadoop完全分布式搭建(腾讯云服务器+阿里云服务器)

Hive系列 (一):Hive搭建

Hive系列 (二):Hive基础知识

Hive系列 (三):Hive开窗函数详解

Hive系列 (四):自定义函数UDF UDTF UDAF

Hive系列 (五):Hive数据类型

Hive系列 (六):Hive数据类型转换

Hive系列 (七):Hive常用函数

Hive系列 (八):Hive中的explode 与 lateral view

Hive系列 (九):Hive数据存储

Hive系列 (十):Hive调优

数据类型转换

同其他语言一样,Hive也包含隐式转换显式转化

  1. Hive会对numeric类型的数据进行隐式转换。
  2. 任何整数类型都可以隐式地转换成一个范围更大的类型。
  3. TINYINT,SMALLINT,INT,BIGINT,FLOAT和STRING都可以隐式 地转换成DOUBLE;BOOLEAN类型不能转换为其他任何数据类型。
  4. 可以使用CAST操作显示进行数据类型转换,例如CAST(‘1’ AS INT)将把字符串’1’ 转换成整数1;如果强制类型转换失败,如执行CAST(‘X’ AS INT),表达式返回空值 NULL

Cast显示转换

可以用CAST来显式的将一个类型的数据转换成另一个数据类型,其语法为cast(value AS TYPE)

0: jdbc:hive2://master:10000> select stu_id,chinese from myhive.stu_scores where stu_id = 10001; OK +---------+----------+ | stu_id | math | +---------+----------+ | 10001 | 70.0 | +---------+----------+ 1 row selected (4.558 seconds) 0: jdbc:hive2://master:10000> select stu_id,cast(math as float) as math from myhive.stu_scores where stu_id = 10001; OK +---------+-------+ | stu_id | math | +---------+-------+ | 10001 | 70.0 | +---------+-------+ 1 row selected (4.105 seconds) 0: jdbc:hive2://master:10000>  # 这样math将会显示的转换成float。如果math是不能转换成float,这时候cast将会返回NULL 

注意事项:

  1. 如果将浮点型的数据转换成int类型的,内部操作是通过round()或者floor()函数来实现的,而不是通过cast实现。
  2. 对于binary类型的数据,只能将binary类型的数据转换成string类型。
  3. 只有binary类型数据是一个数字类型(a number),这时候你可以利用嵌套的cast操作
    select(cast(cast(a as string) as double)) from tb1 

数据类型转换表

boolean tinyint smallint int bigint float double decimal string varchar timestamp date binary
boolean true false false false false false false false false false false false false
tinyint false true true true true true true true true true false false false
smallint false false true true true true true true true true false false false
int false false false true true true true true true true false false false
bigint false false false false true true true true true true false false false
float false false false false false true true true true true false false false
double false false false false false false true true true true false false false
decimal false false false false false false false true true true false false false
string false false false false false false true true true true false false false
varchar false false false false false false true true true true false false false
timestamp false false false false false false false false true true true false false
date false false false false false false false false true true false true false
binary false false false false false false false false false false false false true

日期类型转换说明

有效的转换 结果
cast(date as date) 返回date类型
cast(timestamp as date) timestamp中的年/月/日的值是依赖与当地的时区,结果返回date类型
cast(string as date) 如果string是YYYY-MM-DD格式的,则相应的年/月/日的date类型的数据将会返回;但如果string不是YYYY-MM-DD格式的,结果则会返回NULL。
cast(date as timestamp) 基于当地的时区,生成一个对应date的年/月/日的时间戳值
cast(date as string) date所代表的年/月/日时间将会转换成YYYY-MM-DD的字符串

转换示例

日期与字符串转换

# cast(string as date) # 不是YYYY-MM-DD格式返回null 0: jdbc:hive2://master:10000> select cast('' as date); OK +-------+ | _c0 | +-------+ | NULL | +-------+ 1 row selected (2.135 seconds) 0: jdbc:hive2://master:10000> select cast('2021-08-25' as date); OK +-------------+ | _c0 | +-------------+ | 2021-08-25 | +-------------+ 1 row selected (2.167 seconds) # 日期转字符串 0: jdbc:hive2://master:10000> select cast(current_date() as string); OK +-------------+ | _c0 | +-------------+ | 2021-08-25 | +-------------+ 1 row selected (2.291 seconds) 0: jdbc:hive2://master:10000>  

时间戳与日期转换

# cast(timestamp as date) # 显示当前时间戳current_timestamp() 0: jdbc:hive2://master:10000> select current_timestamp(); OK +--------------------------+ | _c0 | +--------------------------+ | 2021-08-25 16:35:27.249 | +--------------------------+ 1 row selected (2.287 seconds) # 时间戳转日期 0: jdbc:hive2://master:10000> select cast(current_timestamp() as date); OK +-------------+ | _c0 | +-------------+ | 2021-08-25 | +-------------+ 1 row selected (2.399 seconds) # 日期转时间戳 0: jdbc:hive2://master:10000> select cast(current_date() as timestamp); OK +------------------------+ | _c0 | +------------------------+ | 2021-08-25 00:00:00.0 | +------------------------+ 1 row selected (2.325 seconds) 0: jdbc:hive2://master:10000> 
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/233134.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • rapidxml 文件读写,增加删除节点「建议收藏」

    rapidxml 文件读写,增加删除节点「建议收藏」RapidXml是指XMLDOM解析工具包,是一个快速的读写xml文件的库文件(hpp)。本文旨在提供RapidXml文件读写操作,以及对节点的增加、删除、编译提供一个测试用例,以免忘记。1.读取XML#include”rapidxml.hpp”#include”rapidxml_utils.hpp”#include”rapidxml_print.hpp”#includ…

    2022年7月17日
    13
  • 解决spark日志清理问题

    解决spark日志清理问题

    2021年11月27日
    178
  • 国外的大龄程序员在干什么工作_为什么程序员年龄大了没人要

    国外的大龄程序员在干什么工作_为什么程序员年龄大了没人要在Quora有个帖子:我今年35岁了,是不是太老了,没法加入Google,Facebook,Microsoft或者Apple了?下面的回复让人叹为观止,我摘录几个:萨特南·辛格Google软件工程师(2017–present)不,我在51岁的时候加入了Google,我们团队还有几个比我年长的人!他们都是非常卓越的软件工程师,一生都在编程,并且获得了被认为非…

    2025年11月8日
    2
  • python获取股票历史数据_量化交易之如何获取股票历史数据并存为csv

    python获取股票历史数据_量化交易之如何获取股票历史数据并存为csv量化研究尤其是进行基于价值投资的量化研究,需要上市公司的历史估值数据,如市盈率PE,市净率PB,或者市销率PS,市现率PCF。而有的人喜欢用exce或者csv文件的格式存放数据并且分析。我这里介绍一个网站,BaoStock,既支持直接下载历史数据为csv,也支持用程序下载数据并生成csv格式。网站地址是www.baostock.com,如果要下载历史估值数据,进入首页后,选择“沪深A股估值指标(日…

    2022年6月24日
    40
  • 博客园整改之思考_整改思路

    博客园整改之思考_整改思路在博客园写博客写了三年半的时间了,当初为什么会选择在博客园写,我也记不清是什么原因了,或许这大概是缘分吧。今年3月份后半段的时候,博客园突然访问不了了,如今通过搜索资料,仍然发现有部分文章访问不了,

    2022年8月4日
    4
  • 一比一还原axios源码(四)—— Axios类

    axios源码的分析,到目前为止,算上第0章已经四章了,但是实际上,还都没有进入axios真正的主线,我们来简单回顾下。最开始我们构建了get请求,写了重要的buildURL方法,然后我们处理请求体请

    2022年3月25日
    43

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号