es7学习笔记 cpu负载不均衡、超长fullGC、大量400报错[通俗易懂]

es7学习笔记 cpu负载不均衡、超长fullGC、大量400报错[通俗易懂]ElasticSearch负载不均衡现象:往es7集群中推数时,发生如下情况接口出现很多400 发现集群中某台机器cpu被怼爆 发生fullGC产生400报错的原因是es7做了熔断优化,当jvm内存使用超过阈值,为了避免丑陋的oom,会直接限流并抛出EsRejectedExecutionException。我们强硬的关掉了这个配置,因为我们的推数有失败重试。产生fullGC是因为一个bulk批处理的数据量太大,我们一个文档1.5M,800个文档作为一批,两个线程并行推,jvm内

大家好,又见面了,我是你们的朋友全栈君。

现象:往es7集群中推数时,发生如下情况

  1. 接口出现很多400
  2. 发现集群中某台机器cpu被怼爆
  3. 发生fullGC

es7学习笔记 cpu负载不均衡、超长fullGC、大量400报错[通俗易懂]

产生400报错的原因是es7做了熔断优化,当jvm内存使用超过阈值,为了避免丑陋的oom,会直接限流并抛出EsRejectedExecutionException。

我们强硬的关掉了这个配置,因为我们的推数有失败重试。

es7学习笔记 cpu负载不均衡、超长fullGC、大量400报错[通俗易懂]

产生fullGC是因为一个bulk批处理的数据量太大,我们一个文档1.5M,800个文档作为一批,两个线程并行推,jvm内存30G,所以es服务器很快就开始进行fullGC。

所以我们立刻将bulk的数量调整为50,并改为单线程推送,终于没有出现fullGC。

bulk会把将要处理的数据载入内存中,所以数据量是有限制的,最佳的数据量不是一个确定的数值,它取决于你的硬件,你的文档大小以及复杂性,你的索引以及搜索的负载。

一般建议是1000-5000个文档,如果你的文档很大,可以适当减少队列,大小建议是5-15MB,默认不能超过100M,可以在es的配置文件(即$ES_HOME下的config下的elasticsearch.yml)中。

产生单台机cpu爆炸的原因

  1. primary shard主副分片分布不均。
  2. master node既是master node又是data node,master node既要做数据检索,也要做集群的负载均衡转发器,导致每个集群的master node的CPU都很高,因此每次告警首先都是master node。

如果是情况1,则需要移动主分片

例如移动node-1的分片0到node-4。

curl -XPOST 'http://localhost:9200/_cluster/reroute' -d '{
  "commands":[{
  "move":{
    "index":"indexName",
    "shard":0,
    "from_node":"node-1",
    "to_node":"node-4"
}}]}'

优点:操作简单,恢复时间短;不必修改master node的配置,master node长期负载后高

缺点:索引大,移动时有很高的IO,索引容易损坏,需要做备份,不能解决master node既是数据节点又是负载均衡转发器的问题。

注意:分片和副本无法移动到同一个节点

若为情况2,则需重建索引,从另外一个集群导入。

删除原来的索引,重新建立索引;利用elasticsearch dump等工具从另一个集群中把数据导入到新的索引中。

优点:可以重新配置master node和data node,主从负载均匀。

缺点:费时间,容易数据丢失,需要验证数据的一致性。
 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142716.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • map用value值找key的两种方法

    map用value值找key的两种方法map用value值找key的两种方法Map中是一个key有且只有一个value.但是一个value可以对应多个key值.只用用特殊方法才能用value值来找key,以下就是用value值找key的两种方法publicstaticvoidmain(String[]args){//TODOAuto-generatedmethodstub…

    2022年7月23日
    10
  • SecureCRTPortable连接Linxu服务器乱码问题2种方式「建议收藏」

    SecureCRTPortable连接Linxu服务器乱码问题2种方式「建议收藏」1,如下图2,如下图,打开连接,右键ip地址,选择属性3,属性配置,终端>>外观>>字符集编码utf-84,结果

    2022年5月31日
    35
  • 【杂谈】您是以什么姿态来参与讨论、回帖的?

    【杂谈】您是以什么姿态来参与讨论、回帖的?

    2021年8月1日
    50
  • 红旗linux又活过来了_grub引导windows

    红旗linux又活过来了_grub引导windows红旗Linux桌面版4.0软盘启动硬盘安装过程图解(RedFlagLinux4.0)一,准备工作:1,购买或下载红旗Linux桌面版4.0的安装光盘或镜像文件,下载地址:http://www.doczj.com/doc/cc20134b852458fb770b56ff.html/xiazai/xiazai.php?id=13252,在硬盘中至少留2个分区给安装系统用,挂载点所用分区推荐…

    2022年8月20日
    6
  • linux双网卡架设FTP,LINUX系统上架设FTP服务器[通俗易懂]

    linux双网卡架设FTP,LINUX系统上架设FTP服务器[通俗易懂]CentOS上搭建FTP服务器服务器软件:vsftpd简要说明:vsftpd是linux下的一款小巧轻快,安全易用的FTP服务器软件,是一款在各个LINUX发行版中最受推崇的FTP服务器软件。至于它的安装教程,网络上也是数不胜数,每个教程都有各自的优缺点,祥哥特意做了个总结,取别人之长处,尽量做到菜鸟级别的教程。当你看见祥哥的这篇文章,能更好的使用和运用VSFTPD。下面正题开始。安装vsftpd…

    2022年7月21日
    9
  • 怎么理解泊松分布_泊松分布公式

    怎么理解泊松分布_泊松分布公式1甜在心馒头店公司楼下有家馒头店:每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):均值为:按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,的时间不够卖:你“甜在心馒头店”又不是…

    2022年8月30日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号