Hive建表语句浅析

全栈程序员-站长 • 2026年3月17日下午5:09 • 未分类 • 阅读 2

Hive建表语句浅析CREATE EXTERNAL TABLE IFNOTEXISTS table name column namedata type COMMENTcolum comment COMMENTtable comment PARTITIONEDB column namedata type COMMENTcolum comment CLUSTEREDBY column name1 column name2 SOR

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(column_name data_type [COMMENT column_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (column_name data_type [COMMENT column_comment], ...)] [CLUSTERED BY (column_name1, column_name2, ...)] [SORTED BY (column_name [ASC|DESC], ...) INTO num_buckets BUCKETS] [ROW FORMAT DELIMITED] [FIELDS TERMINATED BY fields_format] [LINES TERMINATED BY lines_format] [STORED AS file_format] [LOCATION hdfs_path]

CREATE TABLE

建表关键字，如果表已存在，可以用IF NOT EXISTS忽略异常

EXTERNAL

该关键字指定创建外表，默认不加是创建内表（内表由hive管理生命周期（元数据+数据），外表hive只管理元数据）

COMMENT

字段和表注释

PARTITIONED BY

分区表关键字

CLUSTERED BY

分通表关键字

SORTED BY … INTO * BUCKETS

分通表桶内排序

ROW FORMAT DELIMITED

表存储分隔符，FIELDS TERMINATED BY字段分隔符，LINES TERMINATED BY行分隔符

STORED AS SEQUENCEFILE/TEXTFILE/RCFILE

表存储方式，TEXTFILE纯文本，SEQUENCEFILE数据压缩

LOCATION

表数据在hdfs上的存储路径，内表一般不需要自定义，外表需要指定

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/221848.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

Springboot源码解读

上一篇 2026年3月17日下午5:09

[ExtJS]Layout 布局

下一篇 2026年3月17日下午5:09

各大巨头电商提供的IP库API接口-新浪、搜狐、阿里

各大巨头电商提供的IP库API接口-新浪、搜狐、阿里

全栈程序员-站长
2021年11月5日
40
excel变成xml格式_XML文件

excel变成xml格式_XML文件最近做了一个小工具，可以将XML和Excel之前互转。里面用到的XML读写库是tinyxml，在Excel2010上运行，请先确保装了Excel，而不是WPS。代码写的比较挫，一大坨，最近忙也懒得去做优化了。github地址：XML与Excel互转工具目前只支持ANSI格式的Excel文件与ANSI格式的XML文件互转。由于在写的时候，里面的存储方式都是CString，默认为ANS

全栈程序员-站长
2022年8月22日
8
idea

IDEA和MySQL数据库建立连接

IDEA和MySQL数据库建立连接IDEA和MySQL数据库建立连接操作步骤如下：1.打开IDEA软件，点击顶部导航栏的View–>ToolWindows–>Database（或者直接点击右侧边上的Database），在右侧打开的Database框里，点击左上角的+–>DataSource–>MySQL。2.填入自己的MySQL数据库信息（账户默认root，密码是自己设置的），Database里面填写要连接的数据库名称，填好后点击下方的TestConnection。3.这

全栈程序员-站长
2022年7月19日
37
noip2012提高组初赛_noip2018提高组初赛解析

noip2012提高组初赛_noip2018提高组初赛解析Noip2012参赛总结又一年NOIP考完了。刚刚才看了去年自己写的参赛总结，有点后悔考试之前没有看。里面有一句话“NOIP给的数据都是白痴的，一定要多测几组自己的数据，尽管有些数据你相信你的程序一定能过。但往往正是这些数据暴露出了你程序的不足。”对于DAY1的第二题。我想用深搜来做，尽管我知道过不了多少个点，但总比没有好。于是就以很快的速度敲完了深搜，测了两组数据就去做第三题了。离考试

全栈程序员-站长
2022年8月22日
7
ffi一些常见的错误

ffi一些常见的错误1 安装失败现在 ffi 已经有两年多没人维护了对于 Node 版本的快速迭代 ffi 现在已经连安装都可能失败了本人测试的时候使用 node v10 x node gyp v3 8 的时候总会报错的后面降级为 node v8 13 nbsp node gyp v3 7 安装的时候偶尔还是可以成功建议着两个版本不要太新了会造成 ffi 的一层底层报错如果你降级了还是安装失败的话可以考虑下一

全栈程序员-站长
2026年3月17日
2
psm倾向得分匹配法举例_【计量地图】倾向得分匹配法（PSM）理论、操作与案例…[通俗易懂]

这个方法的难点在于：首先，要明白反事实框架是一个什么样的东西？为什么一般把参与项目和不参与项目进行对比时会出现选择偏误？其次，搞清楚上面的原理之后，PSM真正难的是找到合适的协变量和完成两个苛刻的检验(共同支撑检验和平衡性检验)这篇文章我想达到哪些学习目标：(1)尽量汇集我看过的有用的资料(2)展示一个PSM分析的理论框架(3)针对难点说一下模型的调整问题(协变量选择、两个检验的调整)主要框架：1…

全栈程序员-站长
2022年4月12日
250

发表回复

关注全栈程序员社区公众号