linux+uname+更改信息,更改linux uname

linux+uname+更改信息,更改linux uname更改 DATA 管道 后 下面的代码片段产生所需的输出 请注意 我使用的是 Windows 平台 因此我将替换 rn 请检查 valspark SparkSession builder appName Spark test master local getOrCreate importspark implicits valfile1 spark

更改__DATA__管道“|”后 ,下面的代码片段产生所需的输出。请注意,我使用的是Windows平台,因此我将替换“ r n”。请检查

val spark = SparkSession.builder().appName(“Spark_test”).master(“local[*]”).getOrCreate()

import spark.implicits._

val file1 = spark.sparkContext.textFile(“./in/machine_logs.txt”)

spark.sparkContext.hadoopConfiguration.set(“textinputformat.record.delimiter”,”|”)

val file2 = file1.filter( line => { val x = line.split(“””n”””); x.length > 5 } )

.map( line => { val x = line.split(“””\n”””)

val p = x(2).replaceAll(“\\r”,””) // not needed if Unix platform

val q = x(3).split(” “)(1)

val r = x(4).split(“,”)(2)

(p + “,” + q + “,” + r)

} )

file2.collect.foreach(println)//file2.saveAsTextFile(“./in/machine_logs.out”) –> comment above line and uncomment this line to save in file输出:

2018-11-16T06:3937,hortonworks, 2 users2018-11-16T06:4037,cloudera, 28 usersUPDATE1:

使用正则表达式匹配:

val date_pattern=”[0-9]+-+-+T+:+”.rval uname_pattern=”(Linux) (.*?) [0-9a-zA-z-#() . : _ /]+(GNU/Linux)”.rval cpu_regex=”””(.+),(.*?),s+(load average):+”””.rval file2 = file1.filter( line => { val x = line.split(“””n”””); x.length > 5 } ) .map( line => {

var q = “”; var r = “”;

val p = date_pattern.findFirstIn(line).mkString

uname_pattern.findAllIn(line).matchData.foreach(m=> {q = m.group(2).mkString} )

cpu_regex.findAllIn(line).matchData.foreach(m=> {r = m.group(2).mkString} )

(p + “,” + q + “,” + r)

} )file2.collect.foreach(println)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/234035.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 一个多道批处理仅有p1p2_nx300h的缺点

    一个多道批处理仅有p1p2_nx300h的缺点(注:%0就是该batch文件的文件名 )%~dp0的意思是 更改当前目录为批处理文件的目录 比如你有个批处理a.bat在D:/qq文件夹下  a.bat内容为 cd/d%~dp0 在这里 cd/d%~dp0的意思就是cd/dd:/qq %0代表批处理本身 d:/qq/a.bat ~dp是变量扩充 d既是扩充到分区号 d: p就是扩充到路径 

    2025年12月3日
    4
  • docker中Jenkins安装allure和使用,bash: allure: command not found

    docker中Jenkins安装allure和使用,bash: allure: command not found我的docker中的Jenkins是已经安装allure了的,但是jenkins提示:bash:allure:commandnotfound。原来是我是通过管理员进入jenkins容器安装了allure的,而jenkins是以普通用户去运行的,所以我又以普通用户登录安装allure还是提示:bash:allure:commandnotfound。因为每次jenkins启动都是不同的用户备注:docker中jenkins安装allure可以参考这个链接:https://mp.c

    2022年7月26日
    32
  • 一个c语言程序能实现几种算法_C语言实现算法

    一个c语言程序能实现几种算法_C语言实现算法E-mail:chengwenchi1986@gmail.com摘要:本文主要是对DOA(波达方向)估计中传统MUSIC算法及其改进算法作了简要的介绍,主要包括了MUSIC算法,求根MUSIC算法,循环MUSIC算法,波束空间MUSIC算法,SMARTMUSIC算法。并且在对每个算法做了原理性的分析的基础上给出了简要的性能分析。关键词:DOA估计;MUSIC算法;求根MUSIC算法;循环MUS…

    2025年6月27日
    4
  • Spring Bean生命周期详解「建议收藏」

    Spring Bean生命周期详解「建议收藏」SpringBean生命周期详解

    2026年1月24日
    4
  • 大数据与云计算和物联网之间的关系是什么_大数据信息主要安全问题不包括

    大数据与云计算和物联网之间的关系是什么_大数据信息主要安全问题不包括大数据时代的到来,是全球知名咨询公司麦肯锡最早提出的,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”《互联网进化论》一书中提出“互联网的未来功能和结构将于人类大脑高度相似,也将具备互联网虚拟感觉,虚拟运动,虚拟中枢,虚拟记忆神经系统”,并绘制…

    2022年9月29日
    7
  • Q&A PyCharm安装包失败的解决办法「建议收藏」

    Q&A PyCharm安装包失败的解决办法「建议收藏」问题场景:Win10专业版64位; Administrator用户登陆 PyCharm版本:2020.1.1专业版 安装了三个版本的Python在C:\python目录下,分别为Python3.6.8,3.7.7,3.8.3,都是64位。 在PyCharm中创建三个VirtualenvEnvironment,分别为venv_py36、venv_py37、venv_py38问题描述在PyCharm的ProjectInterpretor中安装包总是失败…

    2022年5月13日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号