pig用法_animals

pig用法_animals1.pig运行模式本地模式:pig-xlocal直接访问本地磁盘集群模式:pig或者pig-xmapreduce2.piglatin交互帮助信息help上传本地文件到

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

1.pig运行模式

本地模式: pig -x local  

 直接访问本地磁盘

集群模式: pig  或者 pig -x mapreduce

2.pig latin 交互

帮助信息 help

pig用法_animals

上传本地文件到hdfs中

pig用法_animals

查看内容 cat 

pig用法_animals

 加载数据

grunt> A = load '/pig/input/a.data' using PigStorage('\t');  --加载文件,并用冒号’\t‘将数据分离为多个字段
grunt> B = foreach A generate $0 as id; --将每一次迭代的第一个元祖数据作为id
grunt> dump B; 在命令行输出结果

pig用法_animals

 执行成功,如下展示:

pig用法_animals

 计算结果

pig用法_animals

 3. 小试牛刀

1)、加载学生信息

student = load ‘/pig/input/student.data’ using PigStorage(‘,’) as (id:long,name:chararray,class:int,state:int);

2)过滤 符合条件的数据

filterStudent= filter student by state==1;

3)展示每个班的学生

groupStudentByClass= group student by class parallel 2;

dump groupStudentByClass;

pig用法_animals

4)统计每个班的人数

groupclass= foreach groupStudentByClass generate $0 as sid,COUNT($1) as total;

dump groupclass;

pig用法_animals

5)join

studentTeacher = join student by class,teacher by clazz;

dump studentTeacher;

pig用法_animals

参考资料:

https://www.ibm.com/developerworks/cn/linux/l-apachepigdataquery/

http://pig.apache.org/docs/r0.16.0/start.html

Apache Pig的一些基础概念及用法总结

<pig编程指南>

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/168014.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 国外代理服务器ip哪个好用?

    国外代理服务器ip哪个好用?哪个类型的IP代理运行得更好?人们在网上冲浪时,常常无意中暴露自己的IP地址,是因特网链路级网关提供的一个重要安全功能,主要工作于开放系统互连(Osl)模型的对话层上,因此可以作为防火墙。那什么类型的IP代理运行得更好呢?目前市场上代理IP的品牌很多,虽然都是代理IP,但具体的功能也各不相同,因为代理IP也有不同的种类,根据不同的需求可以选择哪种代理IP,今天万变代理小编就带你去看看哪个类型的代理IP比较好用?1、Http代理:最常用的代理,代理客户端http访问,主要是代理浏览器访问网页,一般有80、.

    2022年4月29日
    149
  • Oracle中的NULL、’’(空字符串)以及’_’(空格)

    Oracle中的NULL、’’(空字符串)以及’_’(空格)

    2021年9月12日
    135
  • 编程之美2: 二进制重建

    编程之美2: 二进制重建

    2022年1月6日
    43
  • Mybatis–RowBounds

    Mybatis–RowBoundsRowBounds在mybatis中,使用RowBounds进行分页,非常方便,不需要在sql语句中写limit,即可完成分页功能。但是由于它是在sql查询出所有结果的基础上截取数据的,所以在数据量大的sql中并不适用,它更适合在返回数据结果较少的查询中使用最核心的是在mapper接口层,传参时传入RowBounds(intoffset,intlimit)对象,即可完成分页。不需要修改xml配置添加limitmapper接口层代码如下List<Book>

    2022年9月16日
    0
  • 使用adb安装apk命令格式

    使用adb安装apk命令格式adbinstall[-r][-s]-r表示重新安装APK包,-s表示将APK包安装到SD卡上adbinstall[-k]-k表示只删除应用程序,但保留该程序所用的数据和缓存目录

    2022年5月18日
    45
  • Java面向对象三大特征的理解

    Java面向对象三大特征的理解面向对象三大特征的理解初始理解封装继承多态初始理解其实这些知识很早就有接触,而且一些概念也牢记于心了。自己叙述面向对象的特征会是这样的:面向对象的三大特征是封装、继承和多态。封装是对代码的封装以实现迪内聚高耦合的设计,使代码更安全且具有良好的扩展性。继承是父类产生子类的过程,子类可以使用父类的非私有的属性和方法。多态是一个对象在不同时刻可以表现出不同状态的现象。外加Animal和Cat的例子。这一段时间敲了不少的Java代码,在敲代码的过程中想了无数次的面向对象这几个概念,对他们有了更深的了解,在这

    2022年7月15日
    10

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号