Fork me on GitHub

垃圾收集算法

在Java运行时区域中,程序计数器、虚拟机栈、本地方法栈3个区域随线程的而生,随线程而灭,因此这几个区域的内存分配和回收都具有确定性,在这几个区域内就不需要多考虑回收的问题,因此方法结束或者线程结束时,内存自然就跟随着回收了。

而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间才能知道会创建哪些对象,这部分内存的分配都是动态的,垃圾收集器所关注的是这部分内存。

1、判断对象是否“存活”

1.1 引用计数法

给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值减1;任何时刻计数器为0的对象就是不可能再被使用的。

引用计数法的实现简单,判定效率也高,但是主流的Java虚拟机里面没有选用其来管理内存,最主要原因是它很难解决对象之间相互循环引用的问题。

1.2 可达性分析算法

这个算法的基本思想就是通过一系列的“GC Roots”对象作为起始点,从这些节点开始向下搜索。搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时(从图论来说,从GC Roots到这个对象不可达),则证明此对象是不可用的。

在Java语言中,可作为GC Roots的对象包括下面几种:

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  • 方法区中类静态属性引用的对象。
  • 方法区中常量引用的对象。
  • 本地方法栈中JNI(Native方法)引用的对象。

1.3 四种引用类型

引入分为强引用、软引用、弱引用、虚引用4种。

  • 强引用(Strong Reference)

StringBuilder builder = new StringBuilder();

强引用是默认引用类型,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。

  • 弱引用(Weak Reference)

WeakReference<StringBuilder> weakBuilder = new WeakReference<StringBuilder>(builder);

弱引用不是默认引用类型,如果需要使用弱引用,则要明确使用WeakReference类。弱引用用来描述非必需的对象。当内存中的对象只被弱引用时,它将可以被垃圾回收。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。

  • 软引用(Soft Reference)

SoftReference<StringBuilder> softBuilder = new SoftReference<StringBuilder>(builder);

软引用不是默认引用类型,如果需要使用软引用,则要明确使用SoftReference类。软引用用来描述一些还有用但是非必需的对象。对于软引用关联的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。

  • 虚引用(Phantom Reference)

PhantomReference<StringBuilder> phantomBuilder = new PhantomReference<StringBuilder>(builder);

虚引用不是默认引用类型,如果需要使用虚引用,则要明确使用PhantomReference类。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用的唯一目的就是能在这个对象呗收集器回收时收到一个系统通知。

1.4 两次标记过程

如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那么它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。 当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。

如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。 这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环,将很可能会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模标记,如果对象重新与引用链上任何一个对象建立关联,那么第二次标记时它将被移除出“即将回收”的集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。

注意: 任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行。

1.5 回收方法区

方法区的垃圾收集主要回收两部分内容:废弃常量和无用的类。 例如常量池中的字面值常量没有任何对象引用它,并且也没有其他地方引用了这个字面量,则这个变量就是废弃变量。类需要满足3个条件才能算是无用的类:(1)该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例;(2)加载该类的ClassLoader已经被回收;(3)该类对应的java.lang.Class对象没有在任何其他地方被引用,无法在任何地方通过反射访问该类的方法。

虚拟机可以对废弃常量和无用的类进行回收,但并不是一定会回收,是否回收,由虚拟机提供的相关参数进行控制。

2、垃圾收集算法

2.1 标记-清除算法

算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。它的主要不足有两个:一个是效率问题,标记和清除两个过程的效率都不高;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片

2.2 复制算法

它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可。实现简单,运行高效。只是这种算法的代价是将内存缩小为了原来的一半。现在的商业虚拟机都采用这种收集算法来回收新生代

2.3 标记-整理算法

复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低,所以一般不能用于老年代。根据老年代的特点,提出了“标记-整理”算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清除掉端边界以外的内存

2.4 分代收集算法

当前商业虚拟机的垃圾收集都采用“分代收集”算法,根据对象存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清除”或者“标记-整理”算法来进行回收。

求鼓励,求支持!