spark报错OutOfMemory「建议收藏」

最近在使用spark进行分析的时候几千万的数据量感觉不多但是跑起来非常慢内存溢出OutOfMemory1.然后在有使用map的地方在map之前进行分区repartition2.join会有shuffle产生shuffle也会产生数据溢出3.map也可以换成 mapPartitions并且适当调整分区数200400 其他的还有很多我用的就这些然后任务可以跑出来。…

大家好,又见面了,我是你们的朋友全栈君。

最近在使用spark进行分析的时候 几千万的数据量感觉不多 但是跑起来非常慢

内存溢出OutOfMemory

1.然后在有使用map的地方 在map之前进行分区repartition

2.join会有shuffle产生 shuffle也会产生数据溢出

3.map也可以换成 mapPartitions 并且适当调整分区数 200 400 

其他的还有很多 我用的就这些 然后任务可以跑出来。

 

还有什么错误 比如 reset by peer还有什么255的错误

报错信息没有记录

然后使用配置文件去调整

config.set("spark.network.timeout","100000")
    config.set("spark.executor.heartbeatInterval","100s")
    config.set("spark.executor.memory", "50g")
    config.set("spark.shuffle.blockTransferService", "nio")

没用

主要是代码问题。。。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127866.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • rider激活码【最新永久激活】

    (rider激活码)好多小伙伴总是说激活码老是失效,太麻烦,关注/收藏全栈君太难教程,2021永久激活的方法等着你。IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html40Z9P7H9NN-eyJsaWNlbnNlSW…

    2022年3月28日
    609
  • eclipse修改代码后,发现web工程没有做相应修改,除非要project->clean之后界面才做出相应反应

    eclipse修改代码后,发现web工程没有做相应修改,除非要project->clean之后界面才做出相应反应

    2021年7月16日
    283
  • spring配置c3p0连接池、spring的声明式事务管理

    spring配置c3p0连接池、spring的声明式事务管理

    2021年9月26日
    45
  • ps后期调色教程,ps怎么后期调色步骤图「建议收藏」

    ps后期调色教程,ps怎么后期调色步骤图「建议收藏」欢迎来到易夏岚UI设计之Photoshop系列教学课程,今天我们来学习ps后期调色教程,ps怎么后期调色步骤图。在平时修图的过程中,我们常常会遇到修完图以后觉得色彩还是有些不搭配,使得整个图片看起来效果都不是特别好,那么如何使用ps来进行后期的调色呢?今天我们就一起来看一下吧!先附上原图和做完后期的成片,左为原图,右为调色后。这类小清新的照片的后期思路有一个大的方向,用术语来说就是往高调片走,通俗来说就是明度较高(较亮)的片子。在直方图上的一般表现是这样的:大量的照片信息集中在直方图的…

    2022年6月18日
    17
  • ASSERT_VALID_assert语句

    ASSERT_VALID_assert语句ASSERT()ASSERT()被测试它的参数,若参数为0,则中断执行并打印一段说明消息。在Release版本的程序中它不起任何作用。ASSERT()使用的时候必须保证参数表达式中不能有函数调用(译者注:ASSERT()宏在Release版本中不对表达式求值),因此对于任何有函数调用的参数表达式,应该使用宏VERIFY(),以保证表达式中的函数调用在Release版本中会被正确求值…

    2022年9月6日
    7
  • 【Nginx】什么是Nginx?为什么使用Nginx?

    【Nginx】什么是Nginx?为什么使用Nginx?一、前言为毛要用nginx服务器代理,不直接用tomcat7.0,还做多了一次接请求?这个是我想问的,公司的新项目是要用Nginx+tomcat7+jdk开发的,用户命名可以直接访问tomcat,为啥还要用Nginx?这货是个啥玩意?二、什么是Nginx?在传统的Web项目中,并发量小,用户使用的少。所以在低并发的情况下,用户可以直接访问tomcat服务器,然后tomcat服务器…

    2022年7月23日
    15

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号