sqoop从mysql导入hive parquet表timestamp,decimal转换问题

sqoop从mysql导入hive parquet表timestamp,decimal转换问题

注意两个地方:
1.时间转换问题:timestamp、date,time
以上时间类型会被sqoop转成int,long型,无法直接转成时间类型
如果要转的有两个办法:

  • 1)转成long型,再用from_unixtime转回来,才能看时间(太麻烦)—–parquet表的类型对应为bigint
    select *, from_unixtime(cast(SOURCE_LOAD_DATE as BIGINT) DIV 1000000) as SOURCE_LOAD_DATE from table_name;
  • 2)直接转成string型(直观,可以直接看)——parquet表的数据类型对应为string

另外: 处理datetime中有null的情况
在sql connnect中加入:zeroDateTimeBehavior=convertToNull
如:

--connect jdbc:mysql://192.168.1.100/test?zeroDateTimeBehavior=convertToNull

参考:https://avro.apache.org/docs/current/spec.html

2.浮点类型(float,double,decimal)
sqoop导数据使用avro组件,启用小数(decimal) 必须要加以下参数:

-Dsqoop.avro.decimal_padding.enable=true -Dsqoop.parquet.logical_types.decimal.enable=true
-Dsqoop.avro.logical_types.decimal.default.precision=38
-Dsqoop.avro.logical_types.decimal.default.scale=10

—parquet中对应的数据类型为decimal(precision,scale),如decimal(19,3)

参考:https://archive.cloudera.com/cdh6/6.2.0/docs/sqoop-1.4.7-cdh6.2.0/SqoopUserGuide.html#_enabling_logical_types_in_avro_and_parquet_import_for_numbers

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/100396.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux查看文件和目录

    linux查看文件和目录linux查看文件和目录

    2022年4月24日
    51
  • MySQL 事务隔离级别[通俗易懂]

    MySQL 事务隔离级别[通俗易懂]1.理论MySQL中事务的隔离级别一共分为四种,分别如下: 序列化(SERIALIZABLE) 可重复读(REPEATABLEREAD) 提交读(READCOMMITTED) 未提交读(READUNCOMMITTED) 四种不同的隔离级别含义分别如下: SERIALIZABLE ❝如果隔离级别为序列化,则用户之间通过一个接一个顺序地执行当前的事务,这种隔离级别提供了事务之间最大限度的隔离。 REPEATABLEREAD ❝在可

    2022年10月14日
    3
  • @GetMapping和@GetMapping(value=““)的区别纪要「建议收藏」

    问题:@GetMapping指定value和不指定value的区别是什么?背景:刚开始接触时的理解@GetMapping是不需要有value的,以为没有指定的value就无法访问对应的请求接口.后来经过实战和学习……今天有空来立项说明一下.答案: 1.首先要清楚@GetMapping的标准写法肯定是有对应的value指向的. 2.对于没有对应value指向的@GetMapping有且只有一个.在这种情况下当你的路径指向这个@GetMapping的上级路径时系统会默认找寻该.

    2022年4月7日
    162
  • mac xmind快捷键

    mac xmind快捷键tab:新建分支command+z:撤销command+”+”:放大command+”-“:缩小shift+enter:文字换行转载于:https://www.cnblogs.com/yintingting/p/5678890.html

    2022年5月3日
    150
  • java环境变量自动配置工具分享

    java环境变量自动配置工具分享

    2021年9月29日
    57
  • 永恒之蓝(MS17010)漏洞复现

    永恒之蓝(MS17010)漏洞复现文章目录介绍:准备开始复现正式开始利用介绍:永恒之蓝是指2017年4月14日晚,黑客团体ShadowBrokers(影子经纪人)公布一大批网络攻击工具,其中包含“永恒之蓝”工具,“永恒之蓝”利用Windows系统的SMB漏洞可以获取系统最高权限。恶意代码会扫描开放445文件共享端口的Windows机器,无需用户任何操作,只要开机上网,不法分子就能在电脑和服务器中植入勒索软件、远程控制木马、虚拟货币挖矿机等恶意程序准备1.kali的ip:192.168.0.1282.WindowsServer

    2022年5月3日
    273

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号