解决spark日志清理问题

解决spark日志清理问题

背景

由于采用了sparkstreaming 任务一直再运行导致日志文件暴涨,达到了硬盘的预警,不得已必须指定策略定期删除日志已保证服务器硬盘空间。

 

spark的日志分类

spark的日志都有那些:

1.event(history)

2.work

3.executor

 

解决方法

方案1

一开始为了快速实现日志清理,选择了脚本自动清理,写了shell脚本便于清理历史文件,但是会有很多细节甚至有些文件不能删除(由于进程占用),这里不做详细介绍了。

方案2

spark配置来解决这几个问题

conf文件下面的两个文件中修改配置:

1.解决executor(work目录) 日志太大的问题,修改spark-defaut.conf

# 日志循环复写的策略(一般就是size和time)这里受限于空间选择了大小
spark.executor.logs.rolling.strategy size
# 设定复写的大小,这里设定了1G spark.executor.logs.rolling.maxSize
1073741824
# 设定组大保留文件
spark.executor.logs.rolling.maxRetainedFiles 100
# 设定更新周期这里选择一小时检查一次是否超过最大值
spark.executor.logs.rolling.time.interval hourly

2.解决历史日志问题spark-env.sh 文件添加 历史日志清洗参数配置

export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=/export/opt/spark/spark2.4.0/logs -Dspark.history.fs.cleaner.enabled=true -Dspark.history.fs.cleaner.interval=1d -Dspark.history.fs.cleaner.maxAge=2d -Dspark.history.retainedApplications=100"

3.woker日志清理同上文件

export SPARK_WORKER_OPTS="-Dspark.worker.cleanup.enabled=true -Dspark.worker.cleanup.interval=1800 -Dspark.worker.cleanup.appDataTtl=86400"

 

方案3

log4j 替代默认的日志记录,再shell的提交脚本中加入如下参数

--files "./log4j.properties" \
--driver-java-options "-Dlog4j.debug=true -Dlog4j.configuration=log4j.properties" \
--conf spark.driver.extraJavaOptions='-Dlog4j.configuration=file:/opt/spark/conf/log4j.properties' \

 

总结

  再实际应用过程中依然有很多不能日志复写或者不能文件导致日志太大的问题,需要具体问题具体解决。比如spark3.0 才支持history日志循环写。另外yarn模式和standalone 也有很多不同,需要区别处理。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/119634.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 什么是守护进程?

    什么是守护进程?在了解守护进程之前,需要先知道什么是什么是终端?什么是作业?什么是进程组?什么是会话?在Linux中,每一个系统与用户进行交流的界面称为终端,每一个从此终端开始运行的进程都会依附于这个终端,这个

    2022年7月1日
    25
  • vscode设置字体大小和字体_vscode snippet

    vscode设置字体大小和字体_vscode snippetvscode设置字体vscode设置字体查看vscode当前的字体github搜索自己喜欢的字体设置vscode字体配置vscode设置字体安装下载完成后总感觉字体不好看,想换别的字体,怎么办,只需要如下几步即可搞定查看vscode当前的字体****如上图,我得vscode字体是已经设置过的,vscode默认字体是Consolas格式的,我个人不太喜欢,所以就从网上下载别的字体。github搜索自己喜欢的字体比如我下载的就是Hack字体,github上直接搜索Hack字体是直接可以下载安装

    2022年4月19日
    374
  • TCP和UDP的特点_TCP和UDP位于

    TCP和UDP的特点_TCP和UDP位于原文链接:https://www.jianshu.com/p/ef1811b3b44eOSI参考模型和TCP/IP协议群1.TCP/IP协议群的具体含义从字面意义上讲,有人可能会认为TCP/IP是指TCP和IP两种协议.实际生活中有时也确实就是指这两种协议.然而在很多情况下,它只是利用IP进行通信时所必须用到的协议群的统称.具体来说,IP或ICMP,TCP或U…

    2022年9月20日
    4
  • [Unity3D]Unity3D游戏开发之ACT游戏三连击效果实现综述

    [Unity3D]Unity3D游戏开发之ACT游戏三连击效果实现综述

    2021年12月14日
    64
  • pve 和esxi哪个性能强(前后对比)

    ESXi实战1、安装ESXi7;2、在ESXi7上安装VCSA;3、在VCSA上管理ESXi7;4、在ESXi7上安装CentOS7;存储扩容:直接创建VMFS6,然后扩容;遇到的问题:vCenter(VCSA)中无法添加ESXi主机,提示无法找到IP,全部加入域后,问题解决;PVE实战1、安装ProxmoxVE6.1,主机名一定要唯一…

    2022年4月15日
    1.1K
  • linux mysql重置密码_linux系统重置

    linux mysql重置密码_linux系统重置linux的Mysql重置密码(1)先修改配置文件/etc/my.cnf令MySQL跳过登录时的权限检验,在[mysqld]下加入一行:skip-grant-tables(2)重启MySQLsystemctlrestartmysqld(3)免密码登录MySQLskip-grant-tables(4)mysql客户端执行如下命令,修改root密码mysql>usemysql;MySQL>updatemysql.usersetauthentication_s

    2022年10月15日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号