GC三问:

哪些内存需要回收?

什么时候回收?

如何回收?

程序计数器、虚拟机栈、本地方法栈随线程而生,随线程而灭,栈帧的内存分配在类结构确定下来就已知,在方法结束或者线程结束时就会回收。所以垃圾回收关注的是动态的堆内存。

ps. 方法区也能被回收,主要回收废弃常量和无用类,但性价比高,不过多描述。

1.哪些内存需要回收

这个问题的关键就是确定哪些内存是存活着,哪些内存死去(不再会被用到的)

引用计数算法

有引用时就+1,引用失效就-1,计数器为0则可回收

无法回收相互引用的情况

引用分为强引用、软引用、弱引用、虚引用,引用强度递减

  • 强引用

    • 普遍存在的,Object obj = new Object()

    • 只要强引用存在,垃圾收集器永远不会回收掉被引用的对象

  • 软引用

    • 对象在有用但非必须

    • 内存不足时才会回收

    • 实现高速缓存

    • String str = new String("abc");
      SoftReference<String> softRef = new SoftReference<String>(str);
  • 弱引用

    • 非必须,比软引用弱

    • GC时会被回收(概率不大,优先级低)

    • 适用于偶尔被使用不影响垃圾收集的对象

    • String str = new String("abc");
      WeakReference<String> weakRef = new WeakReference<String>(str);
  • 虚引用

    • 不决定对象生命周期

    • 任何时候可回收

    • 跟踪对象被垃圾收集器回收的活动

    • 必须和引用队列ReferenceQueue联合使用

    • String str = new String("abc");
      ReferenceQueue queue = new ReferenceQueue();
      PhantomReference<String> phantomRef = new PhantomReference<String>(str,queue);

可达性分析

从GC Roots作为起始点向下,搜索走过的路径称为引用链,当一个对象到GC Roots没有任何引用链则为不可达,判定为可回收对象。

什么对象可以作为GC Roots

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象
  • 方法区的类静态属性引用的对象
  • 方法区中常量引用的对象
  • 本地方法栈中native方法引用的对象

要判定一个对象的死亡,需要经过两次标记:第一次未与GC Roots相连的节点会经过第一次标记并进行一次筛选。筛选的条件是此对象是否有必要执行finalize()方法(对象没有覆盖finalize()或者finalize()已经被调用过则为没有必要执行)。经过第一次标记后的对象会被放入F-Queue的队列中,由虚拟机自动创建、优先级低的Finalizer线程去执行他。对象可以在finalize()方法中实现自救,如果自救成功会被移出队列,不再回收。

算法实现

GC进行时必须停顿所有Java执行线程,用于枚举根节点,称之为Stop-the-World,减少STW的次数来优化GC。

但程序并非在所有位置都能停顿下来,需要到达SafePoint才能暂停,这种中断方案有两种,抢先式中断和主动式中断。

抢先式中断

中断所有线程,如果线程中断的地方不在SafePoint,恢复线程让他跑到安全点。目前几乎不用

主动式中断

设置一个标志,线程主动轮询这个标志,如果发现需要中断就中断。另外轮询的位置和SafePoint是重合的,也就是在每个安全点会轮询判断是否需要中断。

2.内存分配和回收策略

  • 对象优先在Eden分配

    • Eden区】 空间不足时触发minor GC
    • Survivor区from】 第一次minor GC 从Eden区复制到from 年龄+1
    • Survivor区to】 第二次 minor GC 对Eden和from拷贝到to 年龄+1 from 和to互换 清空from和eden

    在GC开始的时候,对象只会存在于Eden区和From区,To区是空的。紧接着进行GC,Eden区中所有存活的对象都会被复制到To,而在From区中,仍存活的对象会根据他们的年龄值来决定去向。年龄达到一定值(年龄阈值,可以通过-XX:MaxTenuringThreshold来设置)的对象会被移动到年老代中没有达到阈值的对象会被复制到To区域。经过这次GC后,Eden区和From区已经被清空。这个时候,“From”和“To”会交换他们的角色,也就是新的To就是上次GC前的From,新的From就是上次GC前的To。不管怎样,都会保证名为To的Survivor区域是空的。Minor GC会一直重复这样的过程,直到To区被填满,To区被填满之后,会将所有对象移动到年老代中。

    -Xmn10M 分配给新生代的内存

    -XX:SurvivorRatio=8 指定新生代Eden区和Survivor区的空间比例。

  • 大对象直接进入老年代

    可以通过设置-XX:PretenureSizeThreShold,大于这个值的对象直接进入老年代

  • 长期存活的对象进入老年代

  • Full GC触发条件

    • 老年代空间不足
    • 永久代空间不足(JDK7前)
    • CMS GC(Concurrent Mark Sweep 并发标记清理) 出现promotion failed concurrent mode failure
    • promotion failed 年轻代和老年代都放不下
    • 同时有对象要放入老年代,老年代空间不足
    • minor GC晋升到老年代平均大小大于老年代剩余空间
    • System.gc()
    • 使用RMI进行RPC或管理 JDK,一小时一次

3.垃圾回收算法

标记-清除算法(Mark-Sweep)

标记:从根集合扫描,对存活对象标记

清除:对堆内存从头到尾进行线性遍历,回收不可达对象内存

缺点:

  • 效率低:标记和清除两个过程小徐都不高
  • 碎片化:会产生大量不连续的内存碎片,在分配大对象时可能需要提前触发垃圾回收动作

复制算法(Copying)

分为对象面和空闲面,对象在对象面上创建

清理时存活的对象被从对象面复制到空闲面,再将对象面所有对象内存清除

优点:

  • 解决碎片化问题
  • 顺序分配内存,简单高效
  • 适用于对象存活率低的场景(新生代回收)

缺点:

  • 造成内存的缩小,可用内存减少

标记-整理算法

标记:从根集合扫描,对存活对象标记

清除:移动所有存活对象,按照内存地址排序,然后将末端内存地址以后内存全部回收

缺点:

  • 成本高,适用于存活率高的场景

分代收集算法

把堆分成几代,,根据代的特点采用合适的垃圾回收算法

4.垃圾收集器

  • JVM运行模式

JVM有两种运行模式Server与Client。两种模式的区别在于,Client模式启动速度较快,Server模式启动较慢;但是启动进入稳定期长期运行之后Server模式的程序运行速度比Client要快很多。这是因为Server模式启动的JVM采用的是重量级的虚拟机,对程序采用了更多的优化;而Client模式启动的JVM采用的是轻量级的虚拟机。所以Server启动慢,但稳定后速度比Client远远要快。

~ $ java -version
java version "1.8.0_111"
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)

以上命令可以看到当前使用的是什么模式的JVM


以下是新生代收集器

  • 垃圾收集器的联系

Serial收集器 -XX:+UseSerialGC 复制算法

  • 单线程收集
  • 简单高效,client模式默认

ParNew收集器 -XX:+UseParNewGC 复制算法

  • 多线程收集
  • 单核不如Serial 多核有优势

Parallel Scavenge收集器 -XX:+UseParallelGC 复制

  • 吞吐量=(运行用户代码时间/运行用户代码时间+垃圾收集时间)
  • 关注吞吐量
  • 多核执行有优势 server默认
  • -XX:+UseAdaptiveSizePolicy

以下都是老年代的收集器

Serial Old收集器 -XX:+UseSerialOldGC 标记整理算法

  • Client 默认

Parallel Old收集器 标记整理

  • 多线程,吞吐量优先

CMS 收集器 -XX:+UseConcMarkSweepGc 标记清除算法

以获取最短停顿时间为目标。

  • 步骤

    • stop-the-world,初始标记
    • 并发标记:并发追溯标记(与用户线程并发)
    • 并发预清理,查找并发标记阶段从年轻代晋升到老年代对象
    • 重新标记:stop-the-world 扫描CMS剩余对象
    • 并发清理:清理垃圾对象,程序不会停顿(与用户线程并发)
    • 并发重置:重置CMS数据接口
  • 碎片化(标记-清理算法导致)
  • 影响用户程序
  • 无法处理浮动垃圾

Garbage First收集器 -XX:+UseG1GC 复制+标记整理

  • 并行和并发 多CPU
  • 分代收集
  • 空间整合(整体是标记-整理,局部Region是复制),不会有内存碎片
  • 可预测的停顿
  • 将整个java堆内存划分成多个大小相等的Region
  • 年轻代和老年代不再物理隔离

附录

JVM参数速查

参数 描述
-XX:+PrintGCDetail 在垃圾回收时打印内存回收日志
-Xms20M
-Xmx20M
-Xmn10M 指定新生代的堆大小
-XX:SurvivorRatio=8 指定新生代Eden区和Survivor区的空间比例,默认为8
-XX:MaxTenuringThreshold 到达这个年龄成为老年代
-XX:+PretenuerSizeThreshold (survivor区装不下的、新生成的大对象)也会到老年代
-XX:NewRatio 老年代和年轻代内存比例大小
-XX:ParallelGCThreads 限制垃圾收集线程数
-XX:MaxGCPauseMills 控制最大垃圾收集停顿时间(Parallel Scavenge收集器)
-XX:GCTimeRatio 设置吞吐量大小(Parallel Scavenge收集器)
-XX:+UseAdaptiveSizePolicy 不需要指定新生代大小,Eden和survivor比例
GC自适应(Parallel Scavenge收集器)

深入理解JVM(二)垃圾收集器的更多相关文章

  1. 理解JVM之垃圾收集器详解

    前言 垃圾收集器作为内存回收的具体表现,Java虚拟机规范并未对垃圾收集器的实现做规定,因而不同版本的虚拟机有很大区别,因而我们在这里主要讨论基于Sun HotSpot虚拟机1.6版本Update22 ...

  2. 理解JVM之垃圾收集器概述

    前言 很多人将垃圾收集(Garbage Collection)视为Java的伴生产物,实际1960年诞生的Lisp是第一门真正使用内存动态分配与垃圾手机技术的语言.在目前看来,内存的动态分配与内存回收 ...

  3. 深入理解JVM : Java垃圾收集器

    如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现. Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商.不同版本的虚拟机所提供的垃圾收集器都可能会有很大差 ...

  4. 深入理解JVM:垃圾收集器与内存分配策略

    堆里面存放着Java世界差点儿全部的对象实例,垃圾收集器在对堆进行回收前.第一件事情就是要确定这些对象之中哪些还存活,哪些已经死去.推断对象的生命周期是否结束有下面几种方法 引用计数法 详细操作是给对 ...

  5. 深入理解JVM(二)--垃圾收集算法

    一. 概述 说起垃圾收集(Garbage Collection, GC), 大部分人都把这项技术当做Java语言的伴随生产物. 事实上, GC的历史远远比Java久远, 1960年 诞生于MIT的Li ...

  6. 深入理解JVM(三)垃圾收集器和内存分配策略

    3.1 关于垃圾收集和内存分配 垃圾收集和内存分配主要针对的区域是Java虚拟机中的堆和方法区: 3.2 如何判断对象是否“存活”(存活判定算法) 垃圾收集器在回收对象前判断其是否“存活”的两个算法: ...

  7. [转] 深入理解Java G1垃圾收集器

    [From] https://www.cnblogs.com/ASPNET2008/p/6496481.html 深入理解Java G1垃圾收集器 本文首先简单介绍了垃圾收集的常见方式,然后再分析了G ...

  8. 【深入理解JVM】类加载器与双亲委派模型 (转)

    出处: [深入理解JVM]类加载器与双亲委派模型 加载类的开放性 类加载器(ClassLoader)是Java语言的一项创新,也是Java流行的一个重要原因.在类加载的第一阶段“加载”过程中,需要通过 ...

  9. 垃圾收集器与内存分配策略 (深入理解JVM二)

    1.概述 垃圾收集(Garbage Collection,GC). 当需要排查各种内存溢出.内存泄露问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就需要对这些“自动化”的技术实施必要的监控和调 ...

  10. jvm系列 (二) ---垃圾收集器与内存分配策略

    垃圾收集器与内存分配策略 前言:本文基于<深入java虚拟机>再加上个人的理解以及其他相关资料,对内容进行整理浓缩总结.本文中的图来自网络,感谢图的作者.如果有不正确的地方,欢迎指出. 目 ...

随机推荐

  1. 信息收集-DNS

    首先更正一个小白很普遍的错误观点,www.baidu.com(严格上是www.baidu.com. 这个点是根的意思,所有的记录从这里开始)并不是一个真正意义上的域名,而是百度服务器的A记录,baid ...

  2. Redis 的基本数据类型 和 基础应用场景

    Redis 的基础应用场景 获取中奖用户ID,随机弹出之后集合中就不存在了[set] 存储活动中中奖的用户ID,保证同一个用户不会中奖两次[set] 存储粉丝列表,value 为粉丝的用户ID,sco ...

  3. Codeforces Round #651 (Div. 2)

    感觉自己无可救药了. A题:找到小于等于n的两个不同的数的gcd最大是多少,显然是floort(n/2).设这两数是a * gcd, b * gcd然后gcd(a,b) = 1,那么gcd要尽量大,不 ...

  4. 入门大数据---Kafka简介

    一.简介 ApacheKafka 是一个分布式的流处理平台.它具有以下特点: 支持消息的发布和订阅,类似于 RabbtMQ.ActiveMQ 等消息队列: 支持数据实时处理: 能保证消息的可靠性投递: ...

  5. ajax前后端交互原理(5)

    5.ajax简介 5.1.什么是ajax Asynchronous JavaScript and XML ,异步的javascript和XML 5.2.使用ajax有什么用 数据交互,可以从服务器获取 ...

  6. ajax前后端交互原理(1)

    1.Node.js简介 1.1.前后台数据交互流程 在web开发中,我们经常听说前端和后台,他们分别是做什么具体工作的呢?他们怎样交互的呢?我们得把这些基础的问题都搞明白了,才有一个大致的学习方向,首 ...

  7. 你还在担心rpc接口超时吗

    在使用dubbo时,通常会遇到timeout这个属性,timeout属性的作用是:给某个服务调用设置超时时间,如果服务在设置的时间内未返回结果,则会抛出调用超时异常:TimeoutException, ...

  8. 关于gulp复制文件时把整个目录结构都复制的问题解决

    有这么个场景,在开发时分模块开发,但是发布时不一定将按模块分布,比如,为了便于开发,图片是按照模块存放的,但是发布时只是放在images文件夹下,此时就需要用到本文中提到的插件gulp-flatten ...

  9. Python预测2020高考分数和录取情况可能是这样

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:打磨虾 “迟到”了一个月的高考终于要来了. 正好我得到了一份山东新高 ...

  10. docker安装,卸载和入门

    Docker 简介 背景 开发和运维之间因为环境不同而导致的矛盾 集群环境下每台机器部署相同的应用 DevOps(Development and Operations) 简介 Docker是一个开源的 ...