GC的概念

  • Garbage Collection 垃圾收集
  • 1960年 List 使用了GC
  • Java中,GC的对象是堆空间和永久区

GC算法

引用计数法

老牌垃圾回收算法

通过引用计算来回收垃圾

使用者

  • COM
  • ActionScript3
  • Python

引用计数器的实现很简单,对于一个对象A,只要有任何一个对象引用了A,则A的引用计数器就加1,当引用失效时,引用计数器就减1。只要对象A的引用计数器的值为0,则对象A就不可能再被使用。

引用计数法的问题

引用和去引用伴随加法和减法,因为引用的计算是实时的,影响性能。

很难处理循环引用



根对象的引用去掉之后,对于根对象来说,剩下的三个的引用都不为0,所以不会回收,所以引用计数的一个很大的问题就是 垃圾对象的循环引用 ,导致无法被回收

标记清除

标记-清除算法是现代垃圾回收算法的思想基础。标记-清除算法将垃圾回收分为两个阶段:标记阶段和清除阶段。一种可行的实现是,在标记阶段,首先通过根节点,标记所有从根节点开始的可达对象。因此,未被标记的对象就是未被引用的垃圾对象。然后,在清除阶段,清除所有未被标记的对象。



上图左边是标记阶段,右边是清除阶段。

空白区域表示空闲空间,深灰色表示垃圾对象,浅灰色表示存或对象。

从根节点,箭头表示引用,所有的浅灰色的是从根节点的可达对象,这些对象是不应该被回收的,而所有的从根节点不可达的对象,即深灰色的对象为垃圾对象。

标记压缩

标记-压缩算法适合用于存活对象较多的场合,如老年代。它在标记-清除算法的基础上做了一些优化。和标记-清除算法一样,标记-压缩算法也首先需要从根节点开始,对所有可达对象做一次标记。但之后,它并不简单的清理未标记的对象,而是将所有的存活对象压缩到内存的一端。之后, 清理边界外所有的空间



已经标记好了对象,箭头表示移动存活对象,而不是去简单的清除未被标记的对象,移动完了之后把区域外的对象(上图指的是除了第一行)全部清理。

小问题

标记压缩对标记清除而言,有什么优势呢?

复制算法

  • 与标记-清除算法相比,复制算法是一种相对高效的回收方法
  • 不适用于存活对象较多的场合 如老年代
  • 将原有的内存空间分为两块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中的存活对象复制到未使用的内存块中,之后,清除正在使用的内存块中的所有对象,交换两个内存的角色,完成垃圾回收



每次把存活的对象被复制到另一块区域中,复制完之后第一块区域中所有的对象都做一次清理,然后交换角色。

复制算法的最大问题是:空间浪费 整合标记清理思想

因为复制算法,每次都有一半是没有被用的。



主要的对象,对象的产生放在左边最大的区域中,下面的两小块是复制算法的核心。

当垃圾回收进行的时候,大对象直接进入担保空间(年老代),为什么大对象放到年老代中?因为复制区域很小,可能大对象直接就放不进去,也可能大对象放到负值区域,导致原本应该放到负值区域的小对象被挤到了年老代中。

然后老年对象进入老年代,什么叫做老年对象,对象在几次回收之后都没有被回收掉,每次回收后对象的年龄就会加一,当对象到达一定的年龄对象之后,就会变成老年对象,即长期被引用的对象,所以老年对象被放在老年代。

剩下小的、年轻的对象做复制右边的小的区域中去。

根据复制算法,清空原先使用的空间,就形成了右边的结果。

-XX:+PrintGCDetails的输出

  1. Heap
  2. //(0x28d80000-0x27e80000)/1024/1024=15m,即新生代有15m的大小。
  3. //可是这里total为什么是13824K?
  4. //实质上是12288K+ 1536K=13824
  5. //即浪费了from to其中的一个空间,即复制算法所需要浪费的空间。
  6. def new generation total 13824K, used 11223K [0x27e80000, 0x28d80000, 0x28d80000)
  7. eden space 12288K, 91% used [0x27e80000, 0x28975f20, 0x28a80000)
  8. from space 1536K, 0% used [0x28a80000, 0x28a80000, 0x28c00000)
  9. to space 1536K, 0% used [0x28c00000, 0x28c00000, 0x28d80000)
  10. tenured generation total 5120K, used 0K [0x28d80000, 0x29280000, 0x34680000)
  11. the space 5120K, 0% used [0x28d80000, 0x28d80000, 0x28d80200, 0x29280000)
  12. compacting perm gen total 12288K, used 142K [0x34680000, 0x35280000, 0x38680000)
  13. the space 12288K, 1% used [0x34680000, 0x346a3a90, 0x346a3c00, 0x35280000)
  14. ro space 10240K, 44% used [0x38680000, 0x38af73f0, 0x38af7400, 0x39080000)
  15. rw space 12288K, 52% used [0x39080000, 0x396cdd28, 0x396cde00, 0x39c80000)

gc思想以及总结

分代思想

依据对象的存活周期进行分类,短命对象归为新生代,长命对象归为老年代。

根据不同代的特点,选取合适的收集算法

少量对象存活,适合复制算法(年轻代)

大量对象存活,适合标记清理或者标记压缩(年老代)

因为年老代的对象除了是比较大的对象之外,就是在年轻代多次存活的对象,数量比较大,如果是数量比较多的话,复制算法,需要复制的操作比较多,比较消耗性能。

GC算法总结整理

引用计数(没有被Java采用)

标记-清除、标记-压缩(被年老代采用)

复制算法(被新生代采用)

可触及性

所有的算法,需要能够识别一个垃圾对象,因此需要给出一个可触及性的定义

概念

可触及的

从根节点可以触及到这个对象,从根节点开始的引用链条中有这个对象就是可触及的。

可复活的

一旦所有引用被释放,就是可复活状态

因为在finalize()中可能复活该对象

就是在finalize()执行过程中的时候,还没有变成不可触及的时候就是可复活的,可能会再次被触及的,可复活的对象是不能被回收的。

不可触及的

在finalize()执行完之后,可能会进入不可触及状态

不可触及的对象不可能复活

可以回收

举个栗子

  1. public class CanReliveObj {
  2. public static CanReliveObj obj;
  3. @Override
  4. protected void finalize() throws Throwable {
  5. super.finalize();
  6. System.out.println("CanReliveObj finalize called");
  7. obj=this;
  8. }
  9. @Override
  10. public String toString(){
  11. return "I am CanReliveObj";
  12. }
  1. public static void main(String[] args) throws
  2. InterruptedException{
  3. obj=new CanReliveObj();
  4. obj=null; //可复活
  5. System.gc();
  6. Thread.sleep(1000);
  7. if(obj==null){
  8. System.out.println("obj 是 null");
  9. }else{
  10. System.out.println("obj 可用");
  11. }
  12. System.out.println("第二次gc");
  13. obj=null; //不可复活
  14. System.gc();
  15. Thread.sleep(1000);
  16. if(obj==null){
  17. System.out.println("obj 是 null");
  18. }else{
  19. System.out.println("obj 可用");
  20. }
  21. }

结果:

  1. CanReliveObj finalize called
  2. obj 可用
  3. 第二次gc
  4. obj null

解释:

注意第一段代码中的obj=this;

第二段代码中第一次obj=null的时候,是可复活的状态,System.gc();调用了第一段代码的finalize方法,执行obj=this,所以obj可用,但是注意 finalize方法只能被执行一次,所以第二次obj=null,System.gc();的时候不能调用第一段代码中的finalize方法,所以第二次gc的时候输出obj 是 null。

注意点

通过上面的代码,如果第一次执行了finalize放啊,第二次没有执行obj=null,那是不是以为这obj这个对象,永远无法回收?

  • 经验:避免使用finalize(),操作不慎可能导致错误。
  • 优先级低,何时被调用, 不确定

    何时发生GC不确定,所以不建议在finalize里面写代码,被调用的不确定性太大。
  • 可以使用try-catch-finally来替代它

根,上面许多地方所说的根,究竟是什么?

  • 栈中引用的对象
  • 方法区中静态成员或者常量引用的对象(全局对象)
  • JNI方法栈中引用对象

Stop-The-World

  • Java中一种全局暂停的现象
  • 全局停顿,所有Java代码停止,native代码可以执行,但不能和JVM交互,也就是不能做所有应用层面的事情,只能做gc。
  • 多半由于GC引起

    Dump线程

    死锁检查

    堆Dump

    因为Dump线程、死锁检查、堆Dump概率较低,而且多是由于程序员引起,而gc则是由程序自动触发的,所以由gc引起的全局暂停应该引起重视。
  • GC时为什么会有全局停顿?

    类比在聚会时打扫房间,聚会时很乱,又有新的垃圾产生,房间永远打扫不干净,只有让大家停止活动了,才能将房间打扫干净。

    所以gc会出现停顿,新生代停顿的短一点可能是0.000x秒,可是老年代停顿的可能就是几百秒,几十分钟。
  • 危害

    长时间服务停止,没有响应

    遇到HA系统,可能引起主备切换,严重危害生产环境。

    线上系统,主机gc时间较长的时候,备机启动,可是稍后gc完成了主机再次重新启动,主机和备机都启动的状态是十分危险的。

举个栗子

每秒打印10条

  1. public static class PrintThread extends Thread{
  2. public static final long starttime=System.currentTimeMillis();
  3. @Override
  4. public void run(){
  5. try{
  6. while(true){
  7. long t=System.currentTimeMillis()-starttime;
  8. System.out.println("time:"+t);
  9. Thread.sleep(100);
  10. }
  11. }catch(Exception e){
  12. }
  13. }
  14. }
  1. public static class MyThread extends Thread{
  2. HashMap<Long,byte[]> map=new HashMap<Long,byte[]>();
  3. @Override
  4. public void run(){
  5. try{
  6. //大于450M时,清理内存
  7. while(true){
  8. if(map.size()*512/1024/1024>=450){
  9. System.out.println(“=====准备清理=====:"+map.size());
  10. map.clear();
  11. }
  12. //工作线程,消耗内存
  13. for(int i=0;i<1024;i++){
  14. map.put(System.nanoTime(), new byte[512]);
  15. }
  16. Thread.sleep(1);
  17. }
  18. }catch(Exception e){
  19. e.printStackTrace();
  20. }
  21. }
  22. }

运行

  1. -Xmx512M -Xms512M -XX:+UseSerialGC -Xloggc:gc.log -XX:+PrintGCDetails
  2. -Xmn1m -XX:PretenureSizeThreshold=50 -XX:MaxTenuringThreshold=1

结果:

预期,应该是每秒中有10条输出

  1. time:2018
  2. time:2121
  3. time:2221
  4. time:2325
  5. time:2425
  6. time:2527
  7. time:2631
  8. time:2731
  9. time:2834
  10. time:2935
  11. time:3035
  12. time:3153
  13. time:3504
  14. time:4218
  15. ======before clean map=======:921765
  16. time:4349
  17. time:4450
  18. time:4551

注意

  1. time:3153
  2. time:3504
  3. time:4218

这里并不是中间间隔一秒

  1. 3.292: [GC3.292: [DefNew: 959K->63K(960K), 0.0024260 secs] 523578K->523298K(524224K), 0.0024879 secs] [Times: user=0.02 sys=0.00, real=0.00 secs]
  2. 3.296: [GC3.296: [DefNew: 959K->959K(960K), 0.0000123 secs]3.296: [Tenured: 523235K->523263K(523264K), 0.2820915 secs] 524195K->523870K(524224K), [Perm : 147K->147K(12288K)], 0.2821730 secs] [Times: user=0.26 sys=0.00, real=0.28 secs]
  3. 3.579: [Full GC3.579: [Tenured: 523263K->523263K(523264K), 0.2846036 secs] 524159K->524042K(524224K), [Perm : 147K->147K(12288K)], 0.2846745 secs] [Times: user=0.28 sys=0.00, real=0.28 secs]
  4. 3.863: [Full GC3.863: [Tenured: 523263K->515818K(523264K), 0.4282780 secs] 524042K->515818K(524224K), [Perm : 147K->147K(12288K)], 0.4283353 secs] [Times: user=0.42 sys=0.00, real=0.43 secs]
  5. 4.293: [GC4.293: [DefNew: 896K->64K(960K), 0.0017584 secs] 516716K->516554K(524224K), 0.0018346 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
  6. ……省略若干…..
  7. 4.345: [GC4.345: [DefNew: 960K->960K(960K), 0.0000156 secs]4.345: [Tenured: 522929K->12436K(523264K), 0.0781624 secs] 523889K->12436K(524224K), [Perm : 147K->147K(12288K)], 0.0782611 secs] [Times: user=0.08 sys=0.00, real=0.08 secs]

注意:

  1. 3.296: Times: user=0.26 sys=0.00, real=0.28 secs
  2. 3.579Times: user=0.28 sys=0.00, real=0.28 secs
  3. 3.863Times: user=0.42 sys=0.00, real=0.43 secs

综上:因为系统的gc停顿导致了本应该每秒输出的时间有了误差。

因为一个是系统线程(gc),一个是应用级别的线程所以时间的显示可能有些误差。

JVM内核-原理、诊断与优化学习笔记(四):GC算法与种类的更多相关文章

  1. 深入JVM内核---原理,诊断与优化

    JVM的概念 JAM是Java Virtual Machine的简称.意为Java虚拟机 虚拟机 指通过软件模拟的具有完整硬件系统功能的,运行在一种完整隔离环境中的完整计算机系统 有哪些虚拟机 - V ...

  2. JVM内核-原理、诊断与优化学习笔记(八):JAVA堆分析

    文章目录 内存溢出(OOM)的原因 在JVM中,有哪些内存区间? 堆溢出 永久区 Java栈溢出 直接内存溢出 小问题? MAT使用基础 柱状图显示 支配树 显示线程信息 显示堆总体信息,比如消耗最大 ...

  3. JVM内核-原理、诊断与优化学习笔记(七):性能监控工具

    文章目录 系统性能监控 系统性能监控- linux uptime top vmstat(虚拟内存统计) pidstat 系统性能监控 - windows 任务管理器 Perfmon Process E ...

  4. JVM内核-原理、诊断与优化学习笔记(三):常用JVM配置参数

    文章目录 Trace跟踪参数 -verbose:gc (打开gc的跟踪情况) -XX:+printGC(打开gc的log开关,如果在运行的过程中出现了gc,就会打印出相关的信息.) -XX:+Prin ...

  5. JVM内核-原理、诊断与优化学习笔记(二):JVM运行机制

    文章目录 JVM启动流程 PC寄存器 方法区 保存装载的类信息 通常和永久区(Perm)关联在一起 Java堆 Java栈 Java栈 – 局部变量表 ** 包含参数和局部变量 ** Java栈 – ...

  6. JVM内核-原理、诊断与优化学习笔记(六):类装载器

    文章目录 class装载验证流程 class装载验证流程 class装载验证流程 -加载 class装载验证流程 -链接 验证 链接 -> 验证 文件格式的验证 元数据验证(class文件简单语 ...

  7. JVM内核-原理、诊断与优化学习笔记(一):初识JVM

    文章目录 JVM的概念 JVM是Java Virtual Machine的简称.意为Java虚拟机 虚拟机 有哪些虚拟机 VMWare或者Visual Box都是使用软件模拟物理CPU的指令集 JVM ...

  8. JVM内核-原理、诊断与优化学习笔记(十一):JVM字节码执行

    文章目录 javap javap 举个

  9. JVM内核-原理、诊断与优化学习笔记(十):Class文件结构

    文章目录 语言无关性 文件结构 魔数 版本 常量池 CONSTANT_Utf8 CONSTANT_Integer CONSTANT_String CONSTANT_NameAndType CONSTA ...

随机推荐

  1. Python 项目隔离环境virtualenv--venv

    virtualenv 用来为一个应用创建一套“隔离”的python运行环境. 先安装virtualenv: pip3 install virtualenv 再进入项目目录,或者创建一个项目目录并进入, ...

  2. delphi 多线程3

     多线程程序设计 我们知道,win95或winNT都是“多线程”的操作系统,在DELPHI .中,我们可以充分利用这一特性,编写出“多线程”的应用程序. 对以往在DOS或16位windows下写程序的 ...

  3. lnmp mysql高负载优化

    mysql负载会造成cpu占用高的问题如果没启用innodb的话 用这个配置/usr/local/mysql/share/mysql/my-large.cnf 替换/etc/my.cnf 也可参考如下 ...

  4. 微信支付完成 vue 页面不跳转问题

    遇到的问题是 vue 调用微信支付 回调成功以后,页面路由不跳转. 解决的办法是用window.location.href /** * @method 支付费用方法 * @param data:后台返 ...

  5. (转)OpenFire源码学习之十三:消息处理

    转:http://blog.csdn.net/huwenfeng_2011/article/details/43417817 消息处理流程总揽(该图来源于互联网,图片很大,不过类容还是挺清楚的.不方便 ...

  6. CSS:CSS 分组 和 嵌套 选择器

    ylbtech-CSS:CSS 分组 和 嵌套 选择器 1.返回顶部 1. CSS 分组 和 嵌套 选择器 Grouping Selectors 在样式表中有很多具有相同样式的元素. h1 { col ...

  7. hive调用MapReduce之后遇到kill command之后卡住或者一直开在MapReduce之前

    https://blog.csdn.net/weixin_42158422/article/details/88876943

  8. 5、通过Appium Desktop实现页面元素定位

    之前我们已经安装了Appium Desktop,下面就让我们使用Appium Desktop实现页面元素定位 1.首先我们打开Appium Desktop,进入如下界面,点击Start Server ...

  9. 2019牛客多校第二场A-Eddy Walker

    Eddy Walker 题目传送门 解题思路 因为走过所有的点就会停下来,又因为是从0出发的,所以当n>1时,在0停下来的概率为0,其他的为1/(n-1); 代码如下 #include < ...

  10. PAT_A1112#Stucked Keyboard

    Source: PAT A1112 Stucked Keyboard (20 分) Description: On a broken keyboard, some of the keys are al ...