本系列笔记主要基于《深入理解Java虚拟机:JVM高级特性与最佳实践 第2版》,是这本书的读书笔记。

垃圾收集器

垃圾收集算法是是内存回收的方法论,垃圾收集器是内存回收的具体实现。不同的虚拟机会有不同的垃圾收集器的实现,我们主要讨论的是默认的HotSpot虚拟机,这个虚拟机包含的垃圾收集器如下图;


如上图所示,一共有7种垃圾收集器,如果两个垃圾收集器之间有双箭头连线,则两个垃圾收集器可搭配使用。上面是新生代的收集器,下面是老年代的收集器。每个垃圾收集器都有各自适合的使用场景。

Serial 收集器

Serial是一个“单线程”的新生代收集器,使用复制算法,它只会使用一个CPU或者一条收集器线程去完成垃圾收集工作,并且它在垃圾收集时,必须暂停所有其他的工作线程,直到它收集结束。“Stop The World”会在用户不可见的情况下,把用户的工作线程全部停掉,这往往是令人难以接受的。

下图是 Serial/Serial Old 收集器运行示意图:

上图中,新生代是Serial收集器采用复制算法,老年代是Serial Old收集器采用标记-整理算法。Serial虽然是一个缺点鲜明的收集器,但它依然是虚拟机在Client模式下的默认收集器,它也有优点,比如简单高效(与其他收集器单线程相比),对于单个CPU来说,Serial由于没有线程交互的开销,效率比较高,对于桌面应用来说,分配给虚拟机的内存不会很大,收集时的停顿也是在可接受范围内的。

ParNew 收集器

ParNew收集器是Serial收集器的多线程版本,也是使用复制算法的新生代收集器,它除了使用多条线程进行垃圾收集以外,其他的比如收集器的控制参数、收集算法、Stop-The-World、对象分配规则、回收策略都和Serial收集器完全一样。

下图是 ParNew/Serial Old 收集器运行示意图:

上图中,新生代是ParNew收集器采用复制算法,老年代是Serial Old收集器采用标记-整理算法。ParNew是许多Server模式下虚拟机的首选新生代收集器,多是因为它能与CMS收集器配合工作。CMS收集器是HotSpot虚拟机中第一个并发的垃圾收集器,CMS第一次实现了让用户线程与垃圾收集线程同时工作。

简单介绍下垃圾收集中的并行与并发概念:

  • 并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程是等待状态。
  • 并发(Concurrent):指用户线程与垃圾收集线程同时执行,用户程序运行的同时,垃圾收集程序运行于另一个CPU上。

Parallel Scavenge 收集器

Parallel Scavenge也是使用复制算法的新生代收集器,并且也是一个并行的多线程收集器。Parallel收集器跟其它收集器关注GC停顿时间不同,它关注的是吞吐量。低停顿时间适合需要与用户交互的程序,而高吞吐量可以高效率的利用CPU时间,能尽快完成运算任务,适合用于后台计算较多而交互较少的任务。

  • 吞吐量(Throughput):CPU用于运行用户代码的时间与CPU总消耗时间的比值,吞吐量 = 运行用户代码时间 /(运行用户代码时间+垃圾收集时间)。

Parallel收集器提供了两个虚拟机参数用以控制吞吐量,-XX:MaxGCPauseMillis参数可以控制垃圾收集的最大停顿时间,-XX:GCTimeRatio参数可以直接设置吞吐量大小。

-XX:MaxGCPauseMillis的值是一个大于0的毫秒数,使用它减小GC停顿时间是牺牲吞吐量和新生代空间换来的,例如系统把新生代调小,收集300M的新生代肯定比500M的快,这也导致垃圾收集发生的更频繁,原来10秒收集一次每次停顿100毫秒,现在5秒收集一次每次停顿70毫秒,停顿时间下降了,但是吞吐量也下降了。

-XX:GCTimeRatio的值是一个0到100的整数,通过它我们告诉JVM吞吐量要达到的目标值,-XX:GCTimeRatio=N指定目标应用程序线程的执行时间(与总的程序执行时间)达到N/(N+1)的目标比值。例如,它的默认值是99,就是说要求应用程序线程在整个执行时间中至少99/100是活动的(GC线程占用其余的1/100),也就是说,应用程序线程应该运行至少99%的总执行时间。

除这两个参数外,还有一个参数-XX:-UseAdaptiveSizePolicy值得关注,这是一个开关参数,当它打开之后,就不需要手工指定新生代大小(-Xmn)、Eden与Survivor区的比例(-XX:SurvivorRatio)、晋升老年代对象年龄(-XX:PretenureSizeThreshold)等细节参数了,虚拟机会根据系统的运行情况收集性能监控信息,动态的调整这些参数来提高GC性能,这种调节方式称为GC自适应调节策略。这个参数是默认激活的,自适应行为也是JVM优势之一。

Serial Old 收集器

Serial Old是Serial收集器的老年代版本,同样是一个“单线程”收集器,使用标记-整理算法。这个收集器主要是给Client模式下的虚拟机使用,Server模式下还有两个用途,一个是在JDK1.5及之前的版本中与Parallel Scavenge收集器搭配使用,另一个是作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用。工作过程请看Serial 收集器部分的 Serial/Serial Old 收集器运行示意图。

Parallel Old 收集器

Parallel Old收集器是Parallel Scavenge的老年代版本,使用多线程标记-整理算法。此收集器在JDK1.6中开始出现,在Parallel Old出现之前,只有Serial Old能够与Parallel Scavenge收集器配合使用。由于Serial Old这种单线程收集器的性能拖累,导致在老年代比较大的场景下,Parallel Scavenge和Serial Old的组合吞吐量甚至还不如ParNew加CMS的组合。而有了Parallel Old收集器之后,Parallel Scavenge与Parallel Old成了名副其实的吞吐量优先的组合,在注重吞吐量和CPU资源敏感的场景下,都可以优先考虑这对组合。

下图是 ParNew/Serial Old 收集器运行示意图:

CMS 收集器

CMS(Concurrent Mark Sweep)收集器是基于标记-清除算法的老年代收集器,它以获取最短回收停顿时间为目标。CMS是一款优秀的收集器,特点是并发收集、低停顿,它的运行过程稍微复杂些,分为4个步骤:

  1. 初始标记(CMS initial mark)
  2. 并发标记(CMS concurrent mark)
  3. 重新标记(CMS remark)
  4. 并发清除(CMS concurrent sweep)

4个步骤中只有初始标记、重新标记这两步需要“Stop The World”。初始标记只是标记一下GC Roots能直接关联的对象,速度很快。并发标记是进行GC Roots Tracing的过程,也就是从GC Roots开始进行可达性分析。重新标记则是为了修正并发标记期间因用户线程继续运行而导致标记发生变动的那一部分记录。并发清理当然就是进行清理被标记对象的工作。

下图是 CMS 收集器运行示意图:

整个过程中,并发标记与并发清除过程耗时最长,但它们都可以与用户线程一起工作,所以整体上说,CMS收集器的内存回收过程是与用户线程一起并发执行的。

但是CMS收集器也并不完美,它有以下3个缺点:

  1. CMS收集时对CPU资源非常敏感,并发阶段虽然不会导致用户线程停顿,但是会因为占用CPU资源导致应用程序变慢、总吞吐量变低。
  2. CMS收集器无法处理浮动垃圾(Floating Garbage),可能会产生Full GC。浮动垃圾就是在并发清理阶段,依然在运行的用户线程产生的垃圾。这部分垃圾出现在标记过程之后,CMS无法在当次集中处理它们,只能等下一次GC时清理。
  3. CMS是基于标记-清除算法的收集器,可能会产生大量的空间碎片,从而无法分配大对象而导致Full GC提前产生。

G1 收集器

G1(Garbage-First)收集器是面向服务端应用的垃圾收集器,它被寄予厚望以用来替换CMS收集器。在G1之前的收集器中,收集的范围要么是整个新生代要么就是老年代,而G1不再从物理上区分新生代老年代,G1可以独立管理整个Java堆。它将Java堆划分为多个大小相等的独立区域(Region),虽然还有新生代老年代的概念,但不再是物理隔离的,而都是一部分Region(不需要连续)的集合。

与其他收集器相比,G1收集器的特点有:

  1. 并行与并发:G1能充分利用多CPU或者多核心的CPU,来缩短Stop The World的停顿时间。
  2. 分代收集:虽然G1收集器可以独立管理整个GC堆,但它能采用不同的方式处理“新对象”和“老对象”,以达到更好的收集效果。
  3. 空间整合:G1从整体看是基于标记-整理算法的,从局部看(两个Region之间)是基于复制算法实现的,这两个算法在收集时都不会产生空间碎片,这样就有连续可用的内存用以分配大对象。
  4. 可预测的停顿:G1除了追求低停顿外,还能建立可预测的停顿时间模型,可以明确指定一个最大停顿时间(-XX:MaxGCPauseMillis),停顿时间需要不断调优找到一个理想值,过大过小都会拖慢性能。

G1收集器之所以能建立可预测的停顿时间模型,是因为它可以避免在整个Java堆中进行全区域的垃圾收集,G1根据各个Region里垃圾堆积的价值大小(回收所获空间大小及所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region,这也是Garbage-First名称的由来。

G1收集器的Region如下图所示:

图中的E代表是Eden区,S代表Survivor,O代表Old区,H代表humongous表示巨型对象(大于Region空间的对象)。从图中可以看出各个区域逻辑上并不是连续的,并且一个Region在某一个时刻是Eden,在另一个时刻就可能属于老年代。G1在进行垃圾清理的时候就是将一个Region的对象拷贝到另外一个Region中。

再介绍一个概念:Remembered Set(记忆集)。每个Region中都有一个Remembered Set,记录的是其他Region中的对象引用本Region对象的关系(谁引用了我的对象)。所以在垃圾回收时,在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。G1里面还有另外一种数据结构叫Collection Set,Collection Set记录的是GC要收集的Region的集合,Collection Set里的Region可以是任意代的。在GC的时候,对于跨代对象引用,只要扫描对应的Collection Set中的Remembered Set即可。

不算上维护Remembered Set的话,G1收集器的收集过程如下图所示:

如图所示,G1收集过程有如下几个阶段:

  1. 初始标记(Initial Marking)
  2. 并发标记(Concurrent Marking)
  3. 最终标记(Final Marking)
  4. 筛选回收(Live Data Counting and Evacuation)

初始标记只标记一下GC Roots能关联到的对象,需要停顿线程但是耗时短,会停顿用户线程(Stop the World)。并发标记是从GC Root开始对堆中对象进行可达性分析,找出存活对象,这阶段耗时长但是可以与用户线程并发执行。最终标记就是为了修正在并发标记阶段,因用户线程继续运行而导致标记产生变动的那一部分标记记录,这阶段需要停顿用户线程(Stop the World),但是可并行执行。筛选回收阶段会对各个Region的回收价值和成本进行排序,根据用户期望的GC停顿时间来制定回收计划,该阶段也是会停顿用户线程(Stop the World)。

垃圾收集参数

查询当前使用的垃圾收集器:
java -XX:+PrintCommandLineFlags -version
此命令让JVM打印出那些已经被用户或者JVM设置过的详细的XX参数的名称和值。

VM参数 描述
-XX:+UseSerialGC 指定Serial收集器+Serial Old收集器组合执行内存回收
-XX:+UseParNewGC 指定ParNew收集器+Serilal Old组合执行内存回收
-XX:+UseParallelGC 指定Parallel收集器+Serial Old收集器组合执行内存回收
-XX:+UseParallelOldGC 指定Parallel收集器+Parallel Old收集器组合执行内存回收
-XX:+UseConcMarkSweepGC 指定CMS收集器+ParNew收集器+Serial Old收集器组合执行内存回收。优先使用ParNew收集器+CMS收集器的组合,当出现ConcurrentMode Fail或者Promotion Failed时,则采用ParNew收集器+Serial Old收集器的组合
-XX:+UseG1GC 指定G1收集器并发、并行执行内存回收
-XX:+PrintGCDetails 打印GC详细信息
-XX:+PrintGCTimeStamps 输出GC的时间戳(以基准时间的形式)
-XX:+PrintGCDateStamps 输出GC的时间戳(以日期的形式)
-XX:+PrintHeapAtGC 在进行GC的前后打印出堆的信息
-XX:+PrintTenuringDistribution 在进行GC时打印survivor中的对象年龄分布信息
-Xloggc:$CATALINA_HOME/logs/gc.log 指定输出路径收集日志到日志文件
-XX:NewRatio 新生代与老生代(new/old generation)的大小比例(Ratio). 默认值为 2
-XX:SurvivorRatio eden/survivor 空间大小的比例(Ratio). 默认值为 8
-XX:GCTimeRatio GC时间占总时间的比率,默认值99%,仅在Parallel Scavenge收集器时生效
-XX:MaxGCPauseMills 设置GC最大停顿时间,仅在Parallel Scavenge收集器时生效
-XX:PretensureSizeThreshold 直接晋升到老年代的对象大小,大于这个参数的对象直接在老年代分配
-XX:MaxTenuringThreshold 提升年老代的最大临界值(tenuring threshold). 默认值为 15
-XX:UseAdaptiveSizePolicy 动态调整Java堆中各个区域的大小及进入老年代的年龄
-XX:HandlePromotionFailure 是否允许分配担保失败,即老年代的剩余空间不足以应付新生代整个Eden和Survivor中对象都存活的极端情况
-XX:ParallelGCThreads 设置垃圾收集器在并行阶段使用的线程数,默认值随JVM运行的平台不同而不同
-XX:ParallelCMSThreads 设定CMS的线程数量
-XX:ConcGCThreads 并发垃圾收集器使用的线程数量. 默认值随JVM运行的平台不同而不同
-XX:CMSInitiatingOccupancyFraction 设置CMS收集器在老年代空间被使用多少后触发垃圾收集,默认68%
-XX:+UseCMSCompactAtFullCollection 设置CMS收集器在完成垃圾收集后是否要进行一次内存碎片的整理
-XX:CMSFullGCsBeforeCompaction 设定进行多少次CMS垃圾回收后,进行一次内存压缩
-XX:+CMSClassUnloadingEnabled 允许对类元数据进行回收
-XX:CMSInitiatingPermOccupancyFraction 当永久区占用率达到这一百分比时,启动CMS回收
-XX:UseCMSInitiatingOccupancyOnly 表示只在到达阀值的时候,才进行CMS回收
-XX:InitiatingHeapOccupancyPercent 指定当整个堆使用率达到多少时,触发并发标记周期的执行,默认值是45%
-XX:G1HeapWastePercent 并发标记结束后,会知道有多少空间会被回收,再每次YGC和发生MixedGC之前,会检查垃圾占比是否达到此参数,达到了才会发生MixedGC
-XX:G1ReservePercent 设置堆内存保留为假天花板的总量,以降低提升失败的可能性. 默认值是 10
-XX:G1HeapRegionSize 使用G1时Java堆会被分为大小统一的的区(region)。此参数可以指定每个heap区的大小. 默认值将根据 heap size 算出最优解. 最小值为 1Mb, 最大值为 32Mb

JVM探秘:垃圾收集器的更多相关文章

  1. JVM之垃圾收集器

    前一篇讲了垃圾收集算法--JVM之GC算法.垃圾收集算法——标记-清除算法.复制算法.标记-整理算法.分代收集算法,如果把它看作是方法论,那么下面说的就应该是内存回收的具体实现. 先看一下JVM中有哪 ...

  2. 【转载】JVM 学习——垃圾收集器与内存分配策略

    本文主要是对<深入理解java虚拟机 第二版>第三章部分做的总结,文章中大部分内容都来自这章内容,也是博客 JVM 学习的第二部分. 简述 说到垃圾收集(Garbage Collectio ...

  3. JVM、垃圾收集器

    1.Java虚拟机原理 所谓虚拟机,就是一台虚拟的机器.他是一款软件,用来执行一系列虚拟计算指令,大体上虚拟机可以分为系统虚拟机和程序虚拟机, 大名鼎鼎的Vmare就属于系统虚拟机,他完全是对物理计算 ...

  4. JVM之垃圾收集器与内存分配回收策略(二)

    上一篇JVM垃圾收集器与内存分配策略(一),下面是jdk1.7版本的垃圾收集器之间的关系,其中连线两端的两种垃圾收集器可以进行搭配使用,下面来总结一下这些收集器的一些特点以及关系. 一.Serial收 ...

  5. 理解JVM之垃圾收集器详解

    前言 垃圾收集器作为内存回收的具体表现,Java虚拟机规范并未对垃圾收集器的实现做规定,因而不同版本的虚拟机有很大区别,因而我们在这里主要讨论基于Sun HotSpot虚拟机1.6版本Update22 ...

  6. 理解JVM之垃圾收集器概述

    前言 很多人将垃圾收集(Garbage Collection)视为Java的伴生产物,实际1960年诞生的Lisp是第一门真正使用内存动态分配与垃圾手机技术的语言.在目前看来,内存的动态分配与内存回收 ...

  7. JVM各垃圾收集器对比

    本随笔是<深入理解Java虚拟机 JVM高级特性与最佳实践>读书笔记. 1.JDK1.7之后的HotSpot虚拟机所包含的所有收集器如下: 解读: 1. 总共有7种垃圾收集器 2.Seri ...

  8. JVM学习十:JVM之垃圾收集器及GC参数

    接近两个月左右没有写博客,主要是因为小孩过来后,回家比较忙,现在小孩端午送回家了,开始继续之前的JVM学习之路,前面学习了GC的算法和种类,那么本章则是基于算法来产生实际的用途,即垃圾收集器. 一.堆 ...

  9. jvm默认垃圾收集器(JDK789)

    jdk1.7 默认垃圾收集器Parallel Scavenge(新生代)+Parallel Old(老年代) jdk1.8 默认垃圾收集器Parallel Scavenge(新生代)+Parallel ...

  10. JVM中的GC算法,JVM参数,垃圾收集器分类

    一.在JVM中什么是垃圾?如何判断一个对象是否可被回收?哪些对象可以作为GC Roots的根 垃圾就是在内存中已经不再被使用到的空间就是垃圾. 1.引用计数法: 内部使用一个计数器,当有对象被引用+1 ...

随机推荐

  1. Mac OS X 常用快捷键一览

  2. java 删除字符串左边空格和右边空格 trimLeft trimRight

    /** * 去右空格 * @param str * @return */ public String trimRight(String str) { if (str == null || str.eq ...

  3. HZOJ 旋转子段

    作者的正解: 算法一:对于30%的数据: 直接枚举区间直接模拟,时间复杂度O(N3). 算法二:对于60%的数据:枚举旋转中心点,然后再枚举旋转的端点, 我们可以用O(n)的预处理求前缀和记录固定点, ...

  4. 性能改善后复杂SQL

    <?xml version="1.0" encoding="UTF-8" ?><!DOCTYPE mapper PUBLIC "-/ ...

  5. [C#] ServiceStack.Redis如何批量的pop数据?

    要安全的批量pop数据,有两个办法: 1.用事务(不用事务的话可能导致重复读.ServiceStack的pipeline是没有自带事务的.) 2.执行lua脚本 我这里提供用事务的实现方法: publ ...

  6. vue iframe嵌套页面高度自适应 (ios 宽度扩大的bug , ios展示比例问题)

    <template>   <div class="card-index pt-relative">     <div id="wrapper ...

  7. input 的 pattern 验证表单

    pattern 用于定义验证输入正则表达式 pattern 属性适用于以下 <input> 类型:text, search, url, telephone, email 以及 passwo ...

  8. Native memory allocation (mmap) failed to map 142606336 bytes for committing reserved memory.

    这里写链接内容 问题描述 Java程序运行过程中抛出java.lang.OutOfMemoryError: unable to create new native thread,如下所示: [java ...

  9. java.util.NoSuchElementException: No value present

    错误: java.util.NoSuchElementException: No value present 原因: 经查询博客Java 8 Optional类深度解析发现,究其原因为: 在空的Opt ...

  10. P1019 聪聪理扑克

    题目描述 聪聪的两个小伙伴灵灵和豪豪喜欢打扑克,什么斗地主.德州.牛牛,他们都玩的有模有样. 但是每次玩好扑克他们都不整理一下,所以整理扑克的任务就交到了聪聪的手上. 已知现在桌面上有 n 张扑克牌, ...