理解G1收集器

理解G1收集器G1这个名字是怎么来的collecttheregionswiththeleastlivedatafirst(GarbageFirst).G1适合什么情景多核多CPU而且大内存大内存要求低停顿G1如何实现-XX:MaxGCPauseMillis所设置的目标?首先这个目标是个软指标。对于新生代来说,过G1自动调整新生代的大小。对于老年代来说,每次MixedG…

大家好,又见面了,我是你们的朋友全栈君。

G1这个名字是怎么来的

collect the regions with the least live data first(Garbage First).

G1适合什么情景

  1. 多核多CPU而且大内存
  2. 大内存
  3. 要求低停顿

G1如何实现-XX:MaxGCPauseMillis所设置的目标?

首先这个目标是个软指标。

  1. 对于新生代来说,过G1自动调整新生代的大小。
  2. 对于老年代来说,每次Mixed Garbage Collecttion的时候回收的Rigion个数(基于Mixed Garbage Collection的目标次数,每个Region中的存活对象百分比,以及堆全局的垃圾比例)

G1如何实现避免碎片

无论是新生代还是老年代,使用复制算法。

将一批Region(被称作Collection Set,也就是CSet)复制到另外一批Region中来实现的。

如何避免可达性分析扫描整个堆?

名字叫做Remembered Sets(简称RSets) 每一个Region都有自己的RSets。用来记录对自己Region内对象的引用。

Collection Sets or CSets the set of regions that will be collected in a GC. All live data in a CSet is evacuated (copied/moved) during a GC. Sets of regions can be Eden, survivor, and/or old generation.

Remembered Sets or RSets track object references into a given region. There is one RSet per region in the heap. The RSet enables the parallel and independent collection of a region. The overall footprint impact of RSets is less than 5%.

在什么时机进行Mixed Garbage Collection

在堆的使用率达到-XX:InitiatingHeapOccupancyPercent所设置的使用率时。

那这个使用率具体的计算其实并非是整个堆的内存使用率,而是老年代使用的内存/整个堆内存

那做这个判断的时机是:每次Young GC结束的时候

为什么这么做,因为老年代空间中的使用内存发生变化只有一个情形:Young GC的时候。 所以在这个时候判断是最合理的。

其实是整个G1收集器总是在两种状态之间切换

  • young-only
  • space-reclaimation

那顾名思义,young-only就是只有新生代垃圾回收,有一部分垃圾就会不停地被送入老年代。 而space-reclaimation这个词是从老年代的角度来说的。就是开始重新回收老年代的垃圾。

那当young gc结束,发现堆内存已经达到了阈值的时候,就会开启一个既不是young gc也不是mixed gc的一个过程,叫global concurrent marking

这个所谓global concurrent marking的第一步就是叫initial mark,这一步是STW的。 然而Young GC也是需要做跟initial mark基本相同的处理的,就是找GC Roots直接的引用。所以,这里就公用了。导致initial mark事实上是Young GC的一部分。

global concurrent marking之后,如果判断需要进入space-reclaimation阶段,才会接下来进行mixed gc。

什么是global concurrent marking

是由young gc触发的一系列处理。 分为5个步骤。

  1. initial mark(STW)

    找到GC Roots直接引用的Region(限于Survivor区)。注意并不是对象 这其实是Young GC的一部分

  2. root region scaning

    扫描第一步中找到的Region(Survivor区中的),找到对老年代中对象的引用

  3. concurrent mark

    就是用可达性分析算法扫描所有Region

  4. re-mark(STW)

    标记那些在concurrent mark阶段发生变化的对象

  5. clean up(Partly STW)

    这最后一步最具有迷惑性。好像最后一步就进行垃圾回收一样。其实不是的。

    • 标记死对象,标记哪些存活率最低的region,来让后面的mixed gc来回收
    • 因为有了死对象,擦洗RSets
    • 把空Region送回free list。

G1都有哪些STW处理

⭕️young gc

因为是复制算法 这个复制的过程是STW的。另外提一嘴,这个过程是多线程完成的。

⭕️mixed gc

因为也是采用复制算法。 需要注意的是,mixed gc也包括对新生代的收集。

⭕️global concurrent mark中的initial mark、remark、部分clean up

既然有CMS,为什么要选择G1

原因

  • STW更加可控
  • 由于采用了标记-整理算法,不会产生内存碎片

Humongous Objects的分配和回收

大于Region的空间的一半的算Humongous Objects。

Humongous Objects被分配在Humongous Region,直接在老年代。

这个回收不在mixed gc。

而是在global concurrent marking的最后一步:clean up中。

G1调优

-XX:MaxGCPauseMillis

最大STW时间。这个参数设置的逻辑是最大停顿时间和吞吐量的平衡 因为如果这个参数设置过小,那么GC就会频繁,吞吐量会降低。

-XX:InitiatingHeapOccupancyPercent & -XX:+G1UseAdaptiveIHOP

InitiatingHeapOccupancyPercent简称IHOP

-XX:+G1UseAdaptiveIHOP是默认值,也就是说IHOP是adaptive的

-XX:InitiatingHeapOccupancyPercent是初始值

Full GC的调优

Full GC的例子

  1. 跟CMS一样,浮动垃圾产生的溢出

    增加堆大小 或者增加-XX:ConcGCThreads

  2. 垃圾晋升失败

    方法就是提升-XX:G1ReservePercent同时同比例地增加堆大小。 或者提前启动标记周期:减少-XX:InitiatingHeapOccupancyPercent

转载于:https://juejin.im/post/5bb838486fb9a05d11179865

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144995.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • notepad中文显示乱码_csv文件打开乱码

    notepad中文显示乱码_csv文件打开乱码NotePad打开文件出现中文汉字乱码解决办法现象:出现中文汉字乱码:解决办法:先别着急用notepad修改编码1.用windows系统自带记事本打开,2,选择文件另存为3.如果看到:编码是UTF-84.修改编码改成ANSI再次用notepad打开一般就正常了。修改编码改成ANSI…

    2022年10月14日
    2
  • python 正则 括号_js正则匹配0个或多个空格

    python 正则 括号_js正则匹配0个或多个空格\d匹配一个数字\w匹配一个字母或数字.匹配任意字符*表示任意个字符(包括0个),+表示至少一个字符?表示0个或1个字符^表示行的开头$表示行的结束\s匹配一个空格(也包括Tab等空白符)\s+表示至少有一个空格|A|B可以匹配A或B,所以(P|p)ython可以匹配’Pyth…

    2025年6月3日
    4
  • 国内可用的ntp服务器地址

    国内可用的ntp服务器地址ntp.sjtu.edu.cn202.120.2.101(上海交通大学网络中心NTP服务器地址)s1a.time.edu.cn 北京邮电大学s1b.time.edu.cn 清华大学s1c.time.edu.cn 北京大学s1d.time.edu.cn 东南大学s1e.time.edu.cn 清华大学s2a.time.edu.cn 清华大学s2b.time.edu.c

    2022年6月6日
    85
  • 绑定运行计划sql_plan_baseline[通俗易懂]

    绑定运行计划sql_plan_baseline

    2022年1月23日
    57
  • BufferedWriter导出数据excel文件

    BufferedWriter导出数据excel文件BufferedWriter导出数据BufferedWriter将文本写入字符输出流,缓冲各个字符,从而提供单个字符、数组和字符串的高效写入。可以指定缓冲区的大小,或者接受默认的大小。在大多数情况下,默认值就足够大了js页面//导出数据functionexportData(){vardata={};…

    2022年5月24日
    26
  • PHP程序开发之使用header定义一个php页面为utf-8编码或GBK编码

    PHP程序开发之使用header定义一个php页面为utf-8编码或GBK编码php页面为utf-8编码 header(“Content-type:text/html;charset=utf-8”); php页面为gbk编码 header(“Content-type:text/html;charset=gb2312”); php页面为big5编码 header(“Content-type:text/html;charset=b

    2022年7月11日
    30

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号