使用Spark SQL构建批处理程序

使用Spark SQL构建批处理程序

前言

今天介绍利用
StreamingPro 完成批处理的流程。

准备工作

  • 下载StreamingPro
我们假设您将文件放在了/tmp目录下。

填写配置文件

  • 实例一,我要把数据从ES导出到HDFS,并且形成csv格式。

启动StreamingPro

Local模式:

cd  $SPARK_HOME

./bin/spark-submit   --class streaming.core.StreamingApp \
--master local[2] \
--name test \
/tmp/streamingpro-0.2.1-SNAPSHOT-dev-1.6.1.jar    \
-streaming.name test    \
-streaming.platform spark   \
-streaming.job.file.path file:///tmp/test.json

访问

http://127.0.0.1:4040

可进入Spark UI
集群模式:

cd  $SPARK_HOME

./bin/spark-submit   --class streaming.core.StreamingApp \
--master yarn-cluster \
--name test \
/tmp/streamingpro-0.2.1-SNAPSHOT-dev-1.6.1.jar    \
-streaming.name test    \
-streaming.platform spark   \
-streaming.job.file.path hdfs://cluster/tmp/test.json

这里需要注意的是,配置文件并蓄放到HDFS上,并且需要协商hdfs前缀。这是一个标准的Spark 批处理程序
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/108883.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Linux 系统 top 命令详解

    Linux 系统 top 命令详解文章目录前言top命令关键词详解1.VIRT:virtualmemoryusage虚拟内存2.RES:residentmemoryusage常驻内存3.SHR:sharedmemory共享内存4.DATA:数据占用的内存5.top运行中的交互命令top命令图解前言top命令是Linux下常用的性能分析工具,能够实时显示系统状况,比如cpu、内存的使用等。以下详细介绍top命令。top命令关键词详解1.VIRT:virtualmemoryusa

    2022年9月2日
    3
  • pycharm激活码2021最新(最新序列号破解)[通俗易懂]

    pycharm激活码2021最新(最新序列号破解),https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月18日
    105
  • 关于机械臂的模仿学习

    关于机械臂的模仿学习文章目录1.关键词2.数据集3.框架4.大会/论坛5.相关论文1.关键词模仿学习:Imitationlearning2.数据集图像识别领域的数据集:ImageNet目标检测的数据集:COCO机器问答的数据集:SQuAD3.框架斯坦福的李飞飞实验室,开源了分布式强化学习训练框架SURREAL,用来加速学习过程。团队还发现,用SURREAL框架搭配上文的RoboTurk…

    2022年9月19日
    0
  • 手机怎么模拟125k卡_NFC手机能模拟门禁卡吗?

    手机怎么模拟125k卡_NFC手机能模拟门禁卡吗?支持官方ROM的手机小米、华为、一加、索尼、三星(s4、s5、note3)、google亲儿子、魅族、LG、HTC、努比亚、乐视、moto、联想……不支持官方ROM的手机三星s6、s6e、s7、s7e、s8、s8+等等(官方rom不支持,但刷第三方rom支持,比如三星极光ROM)支持的手表Watch华为Watch2……支持的卡id”NFC卡模拟”能添加和模拟4字节、7字节和10字…

    2022年5月6日
    195
  • linux安装ssh和开启 ssh服务

    1.查看ssh服务的状态输入以下命令:sudoservicesshdstatus如果出现Loaded:error(Reason:Nosuchfileordirectory)提示的话,说名没有安装ssh服务,按照第二步:安装ssh服务。如果出现Active:inactive(dead)说明已经安装了ssh服务,但

    2022年4月14日
    46
  • csv 转 ffm[通俗易懂]

    csv 转 ffm[通俗易懂]1.FFM介绍FFM最初的概念来自Yu-ChinJuan与其比赛队员,是他们借鉴了来自MichaelJahrer的论文中的field概念提出了FM的升级版模型。通过引入field的概念,FFM把相同性质的特征归于同一个field。FFM模型不同于常见的DataFrame格式文件,需要将数据格式转换成如下所示的格式:yfield_1:index_1:value_1…

    2022年5月15日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号