Hive Hsql 常用命令「建议收藏」

Hive Hsql 常用命令「建议收藏」简介Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计。以下介绍常用的Hive的类SQL语句。创建表:hive>createtabletablename(idint,namestri…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

简介

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计。以下介绍常用的Hive的类SQL语句。

创建表:

hive>create table tablename(id int,name string,password string);

创建表时指定分隔符

hive> create table tablename(name string,password string)row format delimited fields terminated by ‘,’;
(指定源数据的分隔符为”逗号”)

加载表

hive> load data inpath ‘/user/hadoop/output7/part-r-00000’ into table tablename;

创建一个新表,结构与某表一样

hive> create table table02 like table01;

创建分区表

hive> create table tablename(id int,line string) partitioned by (dt string,country string);

显示表里有多少条记录(count 数大于50的有多少条记录)

hive>select count(*) from tablename where count>50;

排序用法order by (查询count 数大于50并排序)

select * from tablename where count > 50 order by count;

显示表中有多少分区

hive> show partitions tablename;

显示所有表

hive> show tables;

显示所有与t开头的表

hive> show tables ‘t*’;

显示表的结构信息

hive> describe tablename;

修改表名字

hive> alter table table01 rename to table02;

在原表上新添加一列

hive> alter table tablename add columns(new_col2 int comment ‘a commment’);

hive> alter table tablename add columns(new_col3 int);

删除表

hive> drop table tablename;

从本地文件加载数据:

hive> LOAD DATA LOCAL INPATH ‘/home/hadoop/input/sample.txt’ OVERWRITE INTO TABLE records;

加载分区表

hive> load data inpath ‘/user/hive/warehouse/part-r-00000’ overwrite into table clickstream_log PARTITION(dt = ‘2018-11-30’);

显示所有函数

hive> show functions;

查看函数的用法

hive> describe function substr;

查看数组、map、结构

hive> select col1[0],col2[‘b’],col3.c from complex;

查看数组、map、结构

hive> select col1[0],col2[‘b’],col3.c from complex;

内连接:

hive> SELECT sales., things. FROM sales JOIN things ON (sales.id = things.id);

查看hive为某个查询使用多少个MapReduce作业

hive> Explain SELECT sales., things. FROM sales JOIN things ON (sales.id = things.id);

外连接:

hive> SELECT sales., things. FROM sales LEFT OUTER JOIN things ON (sales.id = things.id);
  hive> SELECT sales., things. FROM sales RIGHT OUTER JOIN things ON (sales.id = things.id);
  hive> SELECT sales., things. FROM sales FULL OUTER JOIN things ON (sales.id = things.id);

in查询:Hive不支持,但可以使用LEFT SEMI JOIN

hive> SELECT * FROM things LEFT SEMI JOIN sales ON (sales.id = things.id);

Map连接:Hive可以把较小的表放入每个Mapper的内存来执行连接操作

hive> SELECT /+ MAPJOIN(things) / sales., things. FROM sales JOIN things ON (sales.id = things.id);

INSERT OVERWRITE TABLE …SELECT:新表预先存在

hive> FROM records2
  > INSERT OVERWRITE TABLE stations_by_year SELECT year, COUNT(DISTINCT station) GROUP BY year
  > INSERT OVERWRITE TABLE records_by_year SELECT year, COUNT(1) GROUP BY year
  > INSERT OVERWRITE TABLE good_records_by_year SELECT year, COUNT(1) WHERE temperature != 9999 AND (quality = 0 OR quality = 1 OR quality = 4 OR quality = 5 OR quality = 9) GROUP BY year;

CREATE TABLE … AS SELECT:新表表预先不存在

hive>CREATE TABLE target AS SELECT col1,col2 FROM source;

创建视图:

hive> CREATE VIEW valid_records AS SELECT * FROM records2 WHERE temperature !=9999;

查看视图详细信息:

hive> DESCRIBE EXTENDED valid_records;

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/190693.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 查看文件内容linux命令_shell查找文件中内容

    查看文件内容linux命令_shell查找文件中内容查看文件内容总览cat由第一行开始显示文件内容tac从最后一行开始显示,可以看出tac是cat的倒着写!nl显示的时候,顺道输出行号!more一页一页的显示文件内容less

    2022年7月30日
    6
  • clion永久激活码2021_在线激活

    (clion永久激活码2021)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月21日
    235
  • pycharm推荐配色和字体_pycharm主题配色方案

    pycharm推荐配色和字体_pycharm主题配色方案pycharm的默认主题和字体什么的真是不敢恭维,尤其是在用惯了vscode的onedarkpro主题后,再看pycharm真是觉得有点。。。在网上找了许久,找到一款类似onedarkpro的主题,同时还下载了彩色括号的插件,换上类似vscode的字体,pycharm顿时顺眼多了。度云自取:https://pan.baidu.com/s/1Ia6oryWUXV3TKT0wjzbAc…

    2022年8月25日
    6
  • 图像识别算法

    图像特征包括颜色特征、纹理特征、形状特征以及局部特征点等。局部特点具有很好的稳定性,不容易受外界环境的干扰。1.局部特征点图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的M×N×3的数据矩阵中,我们看不出任何信息,所以我们必须根据这些数据提取出图像中的关键信息,一些基本元件以及它们的关系。局部特征点是图像特征的局部

    2022年4月4日
    353
  • goland激活服务器(注册激活)

    (goland激活服务器)好多小伙伴总是说激活码老是失效,太麻烦,关注/收藏全栈君太难教程,2021永久激活的方法等着你。IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html23LNPMIJZT-eyJsaWNlbnNlSWQi…

    2022年3月29日
    272
  • 继电器模块典型电路图

    继电器模块典型电路图当控制端电压为0时,Q1基极电压为(12-0.7=11.3V),改变R1的大小便可改变基极电流,当基极电流足够大时,三极管饱合。为了验证以上的分析,我们搭了一个电路,R1取4.7K,此时基极电流为2.4ma,测得Q1ec电压为0.2V,继电器两端电压为11.8V。注意:R1的取值不能太小,要保证基极电流在安全范围,也不能太大,要保证三极管能完全饱合,这个可以通过电压和电阻算出

    2022年6月24日
    39

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号