垃圾回收与算法

2年前 (2022) 程序员胖胖胖虎阿
386 0 0

大家好,我是小羽。

在我们平时的编码过程中,基本不会去关心程序中的内存管理情况以及垃圾回收问题,主要原因是 JVM 帮助我们自动实现了。

既然 JVM 已经帮我们自动完成了,那我们是不是就可以高枕无忧,不用再了解这部分的知识了呢?

其实不然,如果遇到 JVM 处理不了的问题,我们也得靠自己解决,如何去更快的解决他们,就很有必要去先掌握 JVM 的垃圾回收机制以及算法实现。

好了,开始进入我们今天的正文介绍。小羽将会从多个方面,带大家更全面的去了解 JVM 垃圾回收的来龙去脉~

垃圾回收原因

随着程序的不断运行,内存当中的实例对象、变量等信息会越来越多,不及时清理的话,程序的星男就会大大降低,内存不足,还会产生系统的异常。

我们都知道对象是存放到堆中的,我们不断创建对象,堆内存就会越来越多,内存大小是固定的,如果不进行垃圾回收的话,我们的 JVM 就会造成内存泄露的情况。

需要回收的垃圾

如果创建使用完的对象,后面不会在有任何的引用,换句话说就是,这些对象已经死去。那么它就属于需要回收的垃圾。

在 JVM 中,程序计数器、虚拟机栈、本地方法栈都是线程私有的,会随着线程的变化而变化,栈中的对象会伴随着方法的进入和退出,进行入栈和出栈的操作,从而实现自动的内存清理。

内存分类

新生代

新生代适合那些生命周期较短,频繁创建及销毁的对象。

New Generation或者Young Generation。上面大致分为Eden区和Survivor区,Survivor区又分为大小相同的两部分:FromSpace 和ToSpace。新建的对象都是用新生代分配内存,Eden空间不足的时候,会把存活的对象转移到Survivor中,新生代的大小可以由-Xmn来控制,也可以用-XX:SurvivorRatio来控制Eden和Survivor的比例。

旧生代

旧生代适合生命周期相对较长的对象,

Old Generation。用于存放新生代中经过多次垃圾回收仍然存活的对象,例如缓存对象。旧生代占用大小为-Xmx值减去-Xmn对应的值。

持久代

持久代在Sun HotSpot中就是指方法区(有些JVM中根本就没有持久代这中说法)。

Permanent Generation。在Sun的JVM中就是方法区的意思,尽管有些JVM大多没有这一代。主要存放常量及类的一些信息默认最小值为16MB,最大值为64MB,可通过-XX:PermSize及-XX:MaxPermSize来设置最小值和最大值。

确定垃圾

引用计数法

在 Java 中,引用和对象是有关联的。如果要操作对象则必须用引用进行。因此,很显然一个简单的办法是通过引用计数来判断一个对象是否可以回收。简单说,即一个对象如果没有任何与之关联的引用,即他们的引用计数都不为 0,则说明对象不太可能再被用到,那么这个对象就是可回收对象。

可达性分析

为了解决引用计数法的循环引用问题,Java 使用了可达性分析的方法。通过一系列的“GC roots”对象作为起点搜索。如果在“GC roots”和一个对象之间没有可达路径,则称该对象是不可达的。

要注意的是,不可达对象不等价于可回收对象,不可达对象变为可回收对象至少要经过两次标记过程。两次标记后仍然是可回收对象,则将面临回收。

标记清楚算法

最基础的垃圾回收算法,分为两个阶段,标注和清除。标记阶段标记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空间。如图

从图中我们就可以发现,该算法最大的问题是内存碎片化严重,后续可能发生大对象不能找到可利用空间的问题。

复制算法

为了解决 Mark-Sweep 算法内存碎片化的缺陷而被提出的算法。按内存容量将内存划分为等大小的两块。每次只使用其中一块,当这一块内存满后将尚存活的对象复制到另一块上去,把已使用的内存清掉,如图:

这种算法虽然实现简单,内存效率高,不易产生碎片,但是最大的问题是可用内存被压缩到了原本的一半。且存活对象增多的话,Copying 算法的效率会大大降低。

标记整理算法

结合了以上两个算法,为了避免缺陷而提出。标记阶段和 Mark-Sweep 算法相同,标记后不是清理对象,而是将存活对象移向内存的一端。然后清除端边界外的对象。如图:

分代收集算法

分代收集法是目前大部分 JVM 所采用的方法,其核心思想是根据对象存活的不同生命周期将内存划分为不同的域,一般情况下将 GC 堆划分为老生代(Tenured/Old Generation)和新生代(Young Generation)。老生代的特点是每次垃圾回收时只有少量对象需要被回收,新生代的特点是每次垃圾回收时都有大量垃圾需要被回收,因此可以根据不同区域选择不同的算法。

新生代与复制算法

目前大部分 JVM 的 GC 对于新生代都采取 Copying 算法,因为新生代中每次垃圾回收都要回收大部分对象,即要复制的操作比较少,但通常并不是按照 1:1 来划分新生代。一般将新生代划分为一块较大的 Eden 空间和两个较小的 Survivor 空间(From Space, To Space),每次使用 Eden 空间和其中的一块 Survivor 空间,当进行回收时,将该两块空间中还存活的对象复制到另一块 Survivor 空间中。

老年代与标记复制算法

而老年代因为每次只回收少量对象,因而采用 Mark-Compact 算法。

  1. JAVA 虚拟机提到过的处于方法区的永生代(Permanet Generation),它用来存储 class 类,

常量,方法描述等。对永生代的回收主要包括废弃常量和无用的类。

  1. 对象的内存分配主要在新生代的 Eden Space 和 Survivor Space 的 From Space(Survivor 目

前存放对象的那一块),少数情况会直接分配到老生代。

  1. 当新生代的 Eden Space 和 From Space 空间不足时就会发生一次 GC,进行 GC 后,Eden

Space 和 From Space 区的存活对象会被挪到 To Space,然后将 Eden Space 和 From

Space 进行清理。

  1. 如果 To Space 无法足够存储某个对象,则将这个对象存储到老生代。
  2. 在进行 GC 后,使用的便是 Eden Space 和 To Space 了,如此反复循环。
  3. 当对象在 Survivor 区躲过一次 GC 后,其年龄就会+1。默认情况下年龄到达 15 的对象会被移到老生代中。

版权声明:程序员胖胖胖虎阿 发表于 2022年9月20日 下午3:40。
转载请注明:垃圾回收与算法 | 胖虎的工具箱-编程导航

相关文章

暂无评论

暂无评论...