使用Spark SQL构建批处理程序

使用Spark SQL构建批处理程序

前言

今天介绍利用
StreamingPro 完成批处理的流程。

准备工作

  • 下载StreamingPro
我们假设您将文件放在了/tmp目录下。

填写配置文件

  • 实例一,我要把数据从ES导出到HDFS,并且形成csv格式。

启动StreamingPro

Local模式:

cd  $SPARK_HOME

./bin/spark-submit   --class streaming.core.StreamingApp \
--master local[2] \
--name test \
/tmp/streamingpro-0.2.1-SNAPSHOT-dev-1.6.1.jar    \
-streaming.name test    \
-streaming.platform spark   \
-streaming.job.file.path file:///tmp/test.json

访问

http://127.0.0.1:4040

可进入Spark UI
集群模式:

cd  $SPARK_HOME

./bin/spark-submit   --class streaming.core.StreamingApp \
--master yarn-cluster \
--name test \
/tmp/streamingpro-0.2.1-SNAPSHOT-dev-1.6.1.jar    \
-streaming.name test    \
-streaming.platform spark   \
-streaming.job.file.path hdfs://cluster/tmp/test.json

这里需要注意的是,配置文件并蓄放到HDFS上,并且需要协商hdfs前缀。这是一个标准的Spark 批处理程序
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/108883.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 实例分割综述_实例分割面临的问题

    实例分割综述_实例分割面临的问题目前实例分割分为两大类:propose&verify,即先用目标检测找出实例可能的边界框并分类,再对边界框进行前后景分割。这类方法以MaskRCNN为代表。缺点是对拥挤、遮挡、小目标和不规则物体的分割精度不高。 像素级分割。A.半卷积用于实例分割(2018,Novotny)本文用像素级分割实现实例分割。广泛应用于深度学习中提取特征的卷积操作具有不变性,这限制了网络精确…

    2022年8月23日
    5
  • 怎么让笔记本变路由器,亲身试验可用,不用下第三方软件

    怎么让笔记本变路由器,亲身试验可用,不用下第三方软件怎么让笔记本变路由器,亲身试验可用,不用下第三方软件

    2022年4月23日
    57
  • firefox如何安装flash(ubuntu火狐浏览器没网)

    一.前言Ubuntu系统因为开源,免费等特性,很受欢迎,在过程XP退役后,许多不愿升级坑人win8的童鞋开始尝试这些免费的系统。Firefox是Ubuntu系统自带的浏览,在Windows上就广受欢迎,唯一一点不好就是作为系统自带的浏览器,竟然没有Flash插件,如图1;而对于刚接触Ubuntu系统的人来说,习惯了Windows的安装软件方式,在Ubuntu上装插件、软件有点不习惯。下面给大家…

    2022年4月13日
    123
  • Centos7上安装Docker完整版[通俗易懂]

    Centos7上安装Docker完整版[通俗易懂]首先确认你是CentOs7版本: 命令:cat /etc/redhat-release ——————————————————————————————————————————————————————安装步骤:1、 yum安装gcc相关 命令: yum-yinstallgcc(保证能上外网)、yum -y install gcc-c++…

    2022年6月13日
    46
  • 自动伽马校正_python 拟合

    自动伽马校正_python 拟合对lena.jpg进行伽马校正(c=1c=1c=1,g=2.2g=2.2g=2.2)!伽马校正用来对照相机等电子设备传感器的非线性光电转换特性进行校正。如果图像原样显示在显示器等上,画面就会显得很暗。伽马校正通过预先增大RGB的值来排除显示器的影响,达到对图像修正的目的。由于下式引起非线性变换,在该式中,xxx被归一化,限定在[0,1][0,1][0,1]范围内。ccc是常数,ggg为伽马变量(通常取2.22.22.2):x′=c Iingx’=c\{I_{in}}^gx′

    2022年9月24日
    0
  • centos7 socks5代理_ssh代理上网

    centos7 socks5代理_ssh代理上网关于SOCKS5  SOCKS5是一个代理协议,它在使用TCP/IP协议通讯的前端机器和服务器机器之间扮演一个中介角色,使得内部网中的前端机器变得能够访问Internet网中的服务器,或者使通讯更加安全。   正常情况下客户端和服务端的通信:客户端服务端   使用了SOCKS5代理后的通讯:客户端代理服务器服务端#安装ss5依赖yuminstallgcc

    2022年9月29日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号