Hive建表语句浅析

Hive建表语句浅析CREATE EXTERNAL TABLE IFNOTEXISTS table name column namedata type COMMENTcolum comment COMMENTtable comment PARTITIONEDB column namedata type COMMENTcolum comment CLUSTEREDBY column name1 column name2 SOR

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(column_name data_type [COMMENT column_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (column_name data_type [COMMENT column_comment], ...)] [CLUSTERED BY (column_name1, column_name2, ...)] [SORTED BY (column_name [ASC|DESC], ...) INTO num_buckets BUCKETS] [ROW FORMAT DELIMITED] [FIELDS TERMINATED BY fields_format] [LINES TERMINATED BY lines_format] [STORED AS file_format] [LOCATION hdfs_path]
  • CREATE TABLE

建表关键字,如果表已存在,可以用IF NOT EXISTS忽略异常

  • EXTERNAL

该关键字指定创建外表,默认不加是创建内表(内表由hive管理生命周期(元数据+数据),外表hive只管理元数据)

  • COMMENT

字段和表注释

  • PARTITIONED BY

分区表关键字

  • CLUSTERED BY

分通表关键字

  • SORTED BY … INTO * BUCKETS

分通表桶内排序

  • ROW FORMAT DELIMITED

表存储分隔符,FIELDS TERMINATED BY字段分隔符,LINES TERMINATED BY行分隔符

  • STORED AS SEQUENCEFILE/TEXTFILE/RCFILE

表存储方式,TEXTFILE纯文本,SEQUENCEFILE数据压缩

  • LOCATION

表数据在hdfs上的存储路径,内表一般不需要自定义,外表需要指定

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/221848.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午5:09
下一篇 2026年3月17日 下午5:09


相关推荐

  • 各大巨头电商提供的IP库API接口-新浪、搜狐、阿里

    各大巨头电商提供的IP库API接口-新浪、搜狐、阿里

    2021年11月5日
    40
  • excel变成xml格式_XML文件

    excel变成xml格式_XML文件最近做了一个小工具,可以将XML和Excel之前互转。里面用到的XML读写库是tinyxml,在Excel2010上运行,请先确保装了Excel,而不是WPS。代码写的比较挫,一大坨,最近忙也懒得去做优化了。github地址:XML与Excel互转工具目前只支持ANSI格式的Excel文件与ANSI格式的XML文件互转。由于在写的时候,里面的存储方式都是CString,默认为ANS

    2022年8月22日
    8
  • IDEA和MySQL数据库建立连接

    IDEA和MySQL数据库建立连接IDEA和MySQL数据库建立连接操作步骤如下:1.打开IDEA软件,点击顶部导航栏的View–>ToolWindows–>Database(或者直接点击右侧边上的Database),在右侧打开的Database框里,点击左上角的+–>DataSource–>MySQL。2.填入自己的MySQL数据库信息(账户默认root,密码是自己设置的),Database里面填写要连接的数据库名称,填好后点击下方的TestConnection。3.这

    2022年7月19日
    37
  • noip2012提高组初赛_noip2018提高组初赛解析

    noip2012提高组初赛_noip2018提高组初赛解析Noip2012参赛总结又一年NOIP考完了。刚刚才看了去年自己写的参赛总结,有点后悔考试之前没有看。里面有一句话“NOIP给的数据都是白痴的,一定要多测几组自己的数据,尽管有些数据你相信你的程序一定能过。但往往正是这些数据暴露出了你程序的不足。”对于DAY1的第二题。我想用深搜来做,尽管我知道过不了多少个点,但总比没有好。于是就以很快的速度敲完了深搜,测了两组数据就去做第三题了。离考试

    2022年8月22日
    7
  • ffi一些常见的错误

    ffi一些常见的错误1 安装失败现在 ffi 已经有两年多没人维护了 对于 Node 版本的快速迭代 ffi 现在已经连安装都可能失败了 本人测试的时候使用 node v10 x node gyp v3 8 的时候总会报错的 后面降级为 node v8 13 nbsp node gyp v3 7 安装的时候偶尔还是可以成功 建议着两个版本不要太新了 会造成 ffi 的一层底层报错 如果你降级了还是安装失败的话 可以考虑下一

    2026年3月17日
    2
  • psm倾向得分匹配法举例_【计量地图】倾向得分匹配法(PSM)理论、操作与案例…[通俗易懂]

    这个方法的难点在于:首先,要明白反事实框架是一个什么样的东西?为什么一般把参与项目和不参与项目进行对比时会出现选择偏误?其次,搞清楚上面的原理之后,PSM真正难的是找到合适的协变量和完成两个苛刻的检验(共同支撑检验和平衡性检验)这篇文章我想达到哪些学习目标:(1)尽量汇集我看过的有用的资料(2)展示一个PSM分析的理论框架(3)针对难点说一下模型的调整问题(协变量选择、两个检验的调整)主要框架:1…

    2022年4月12日
    250

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号