hivesql导出本地文件

hivesql导出本地文件

介绍

做数据分析的时候,经常会用到hive -e "sql" > xxx.txt或者最原始的hive命令行来获得查询结果,然后再将查询结果放到Excel等工具中,但是如果查询的字段太多,这时候将查询结果放到Excel会经常会碰到错位问题,很是头疼.

解决方案一:借助linux管道替换输出分隔符

样例如下:

# 方法一:sed

hive -e "select * from db.table_name" | sed 's/\t/,/g' > ./abc.txt

 

# 方法二:tr

hive -e "select * from db.table_name" | tr "\t" ","

 

结果查看如下:

$ cat abc.txt 

解决方案二:借助Hive的insert语法

代码如下:

insert overwrite local directory 'path'
row format delimited
fields terminated by ','
select xxxx 
from xxxx;

上面的sql将会把查询结果写到指定目录中,字段之间以‘,’分隔

结果如下:

$ ls path
000000_0
 

官方介绍:

Standard syntax:
INSERT OVERWRITE [LOCAL] DIRECTORY directory1
  [ROW FORMAT row_format] [STORED AS file_format] (Note: Only available starting with Hive 0.11.0)
  SELECT ... FROM ...
 
Hive extension (multiple inserts):
FROM from_statement
INSERT OVERWRITE [LOCAL] DIRECTORY directory1 select_statement1
[INSERT OVERWRITE [LOCAL] DIRECTORY directory2 select_statement2] ...
row_format
  : DELIMITED [FIELDS TERMINATED BY char [ESCAPED BY char]] [COLLECTION ITEMS TERMINATED BY char]
        [MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]
        [NULL DEFINED AS char] (Note: Only available starting with Hive 0.13)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119632.html原文链接:https://javaforall.net

(0)
上一篇 2021年11月27日 下午9:00
下一篇 2021年11月27日 下午9:00


相关推荐

  • linux系统查看网卡命令_linux如何配置网卡

    linux系统查看网卡命令_linux如何配置网卡rhel内核版本号信息:[root@hvrhub~]#uname-aLinuxhvrhub2.6.18-308.el5#1SMPFriJan2717:17:51EST2012x86_64x86_64x86_64GNU/Linux查看网卡的驱动。制造商等信息:[root@hvrhub~]#kudzu–probe–class=network-class:…

    2022年10月19日
    4
  • oracle 创建emp表,dept表

    oracle 创建emp表,dept表废话不多说直接上SQL/*创建empz表*/CREATETABLEEMP(EMPNONUMBER(4)NOTNULL,ENAMEVARCHAR2(10),JOBVARCHAR2(9),MGRNUMBER(4),HIREDATEDATE,SALNUMBER(7,2),COMMNUMBER(7,2),DEPTNONUMBER(2));/*emp表添加数据*/INSERTINTOEMPVALUES(7369,’SMITH’,’CLE..

    2022年5月12日
    59
  • Idea插件安装和管理「建议收藏」

    Idea插件安装和管理「建议收藏」1.打开插件视图点击File->Settings菜单,或Ctrl+Alt+S快捷键.打开设置面板.并切换到Plugins插件视图2.插件的管理和卸载当前idea中安装的所有插件(包括系统本身的和用户自己的)都会展示在列表中,右边的复选框表示当前插件的启用状态.在最右边的面板中显示了插件的具体信息和卸载按钮.当不需要插件时,…

    2022年6月1日
    79
  • git stash 部分文件

    git stash 部分文件开发过程中经常会需要 stash 贮藏 部分文件的场景 无奈 sourcetree 并不支持这种操作 gitkranken 神器是可以的 但是现在收费了 所以只能自己动手命令行搞起来了 参考了一下官方文档 gitstash 命令有如下用法 gitstashlist options gitstashshow stash gitstashdrop q quiet stash gitstash pop apply i stash stash options

    2026年3月16日
    2
  • 明天准备离职了,面对照顾自己的领导,要这样说[通俗易懂]

    明天准备离职了,面对照顾自己的领导,要这样说

    2022年2月13日
    59
  • 用C实现一个简易的软件光栅化渲染器

    用C实现一个简易的软件光栅化渲染器这是一个用 C winform 实现的软件光栅化渲染器 今天拿出来与大家分享一下 希望能起到抛砖引玉的作用 给新人一点启发 结构比较简单 注释比较详细 也欢迎司机们拍砖指点和交流 目的 巩固图形编程知识 理解渲染流水线所做的事情 实现功能 将顶点数据进行一系列处理显示到屏幕上 废话 线框渲染模式 纹理渲染模式 顶点色模式纹理 uv 坐标和顶点色等的透视校正插值纹理双线性过滤采样背面消隐 Cv

    2026年3月26日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号