【JavaEE】简单了解JVM

目录

一、JVM中的内存区域划分

二、JVM的类加载机制

1、类加载的触发时机

2、双亲委派模型 

1.1、向上委派

1.2、向下委派

三、JVM中的垃圾回收机制(GC)

1、确认垃圾

1.1、引用计数(Java实际上没有使用这个方案,但是Python、PHP采用了)

1.1.1、循环引用 

1.2、可达性分析(被Java采用)

2、释放内存 

2.1、标记清除

2.2、复制算法

2.3、标记整理 

2.4、分代回收


一、JVM中的内存区域划分

JVM就是一个Java进程,Java进程会从操作系统中申请一大块内存区域,给Java代码使用。这里申请的一大块内存区域又被进一步划分,给出了不同的用途。

  1. 堆:存放new出来的对象(也就是说对象中成员变量在堆上)
  2. 栈:用来维护方法之间的调用关系(也就是说方法中的局部变量在栈上)
  3. 方法区(Java8之前的叫法)/元数据区(Java8开始的叫法):存放的是类加载之后的类对象(类名.class)。也就是存在被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码缓存等数据的。

❌❌这里需要明确的一点,我们在网上看到的有些资料中,说到内置类型的变量是在栈上,引用类型的变量是在栈上。这个说法是错误的

  • 这里变量在堆上还是在栈上,与这个变量是什么类型无关,如果你在类中定义了一个内置类型的变量,通过new关键字,创建这个类的对象,那么这个内置类型的变量,就是在堆上。
  • 判断一个变量在堆上还是在栈上,需要关注的是这个变量是局部变量还是在成员变量如果是局部变量则这个变量在栈上。如果是成员变量则这个变量在堆上
public class Test{
    public int a;
    public String b;
}
class Test1{
    public static void main(String[] args){
        Test s = new Test();
    }
}
//通过上述的代码,可以看见定义的int类型的变量a是一个内置类型的变量,但是他是一个成员变量,所以它在堆上。
//在main方法中的s变量是对象的引用,他是一个引用类型的变量,他在main方法内部是一个局部变量,所以变量s在栈上。

 ​​​【JavaEE】简单了解JVM_第1张图片

  1. 虚拟机栈早期也叫Java栈,每个线程在创建时都会创建一个虚拟机栈,其内部保存一个个的栈帧,对应这一次次的Java方法调用虚拟机栈是给Java代码使用的。主管Java程序的运行,它保存方法的局部变量。部分结果,并参与方法的调用和返回
  2. 本地方法栈:是给jvm内部的本地方法使用的。(jvm内部是通过C++代码实现的方法)。
  3. 程序计数器:是用来记录当前程序执行到那个字节码指令了。

堆和元数据区(方法区)在一个JVM进程中只有一份。但是栈(本地方法栈和虚拟机栈)和程序计数器则是存在多份,每个线程中都会存在一份(栈和程序计数器)。

二、JVM的类加载机制

把.class文件加载到内存得到类对象的过程称为类加载。因为程序要执行,就需要把依赖的"指令和数据"加载到内存中。类加载的过程有5个步骤:加载、验证、准备、解析、初始化。

1️⃣加载阶段(Loading)

这个阶段是找到.class文件,并且读取文件内容。这里找class文件的方法中最常问到的是双亲委派模型。

2️⃣验证阶段(Verification)

这一阶段的目的是确保Class文件的字节流中包含的信息符合《Java虚拟机规范》的全部约束要求,保证这些信息被当作代码运行后不会危害虚拟机自身的安全。

3️⃣准备阶段(Preparation)

给类对象分配内存空间,这里分配的内存空间是未初始化的空间,内存空间中的数据是全0的。

4️⃣解析阶段(Resolution)

针对字符串常量进行初始化。也就是Java虚拟机将常量池内的符号引用替换为直接引用的过程。

  • 符号引用:字符串常量本身在class文件中存在,但是因为他是在文件中,还没有在内存中,并不直到自己的地址,只能使用一些特殊符号来占位。这就得到了符号引用。
  • 直接引用:将字符串常量加载到了内存中,就会把字符串常量填充到内存中的特定地址上,但是字符串在内存中的相对位置与class文件中相对位置还是不变的。

5️⃣初始化阶段(Initialization)

针对类对象进行初始化。初始化静态成员变量、执行静态代码块、如果一个类存在父类,还需要加载父类。

1、类加载的触发时机

类加载不是JVM一启动,就会把所有的.class文件都在加载了,他是一个"懒加载"的策略,也就是非必要不加载。

只有在下面的情况下才会触发类加载

  1. 创建了这个类的实例,这个时候就会触发类加载
  2. 虽然没有创建这个类的实例,但是使用了这个类的静态方法或者静态属性就会触发类加载
  3. 使用子类,会触发父类的加载

2、双亲委派模型 

双亲委派模型正对的是Java虚拟机中三个类加载器的,这三个加载器分别是:

  • 启动类加载器(BootStrap ClassLoader):负责加载Java标准库中的类
  • 扩展类加载器(Extension ClassLoader):负责加载一些非标准库的类,是由Sun/Oracle扩展的库的类。(因为Java最初是是属于Sun公司的但是最后被Oracle公司收购)
  • 应用程序类加载器(Application ClassLoader):负责加载项目中自己写的类以及第三方库中的类。

 当具体加载一个类的时候,它的过程是:需要先给定一个类的权限定类名"java.lang.String"(字符串)。然后是向上委派,在然后是向下委派

1.1、向上委派

然后从Application ClassLoader这个类加载器开始,收到类加载的请求后,不会自己记载这个类,而是把这个类加载请求向上委派给它的父类去完成,父类收到这个请求后又继续向上委派给自己的父类,一次类推,直到所有的请求委派到启动类加载器中。

【JavaEE】简单了解JVM_第2张图片

1.2、向下委派

BootStrap ClassLoader接收到类加载请求后,先是在自己负责的范围内查找,如果搜索到,就直接进行后续加载步骤(验证、准备、解析、初始化),如果没有搜索到这个类,父类会把这个信息返回交给孩子(Extension ClassLoader)来处理,直到这个请求被成功加载,但是一直到自定义加载器都没有找到,JVM就会抛出ClassNotFund异常

【JavaEE】简单了解JVM_第3张图片

 

三、JVM中的垃圾回收机制(GC)

JVM的垃圾回收机制是帮助程序员自动释放内存的。内存释放这是一个比较难把控的事情,因为申请内存的时机是明确的,使用到了就必须申请,释放的时候是模糊的,彻底不使用了才能释放。这就特别依赖程序员的水平,就像C/C++程序员他们释放内存就需要自己手动释放。但是Java通过JVM自动判定,基于一系列策略,就可以让这个准确性比较高。这里我们说的释放内存空间指的就是释放堆上的申请的空间。

垃圾回收主要分为两个阶段:

  1. 确认垃圾:找没有被引用的对象
  2. 释放垃圾:将找到的对象释放掉 

如何判断一个对象是否有引用指向,这里有两个方法:引用计数和可达性分析。

1、确认垃圾

1.1、引用计数(Java实际上没有使用这个方案,但是Python、PHP采用了)

【JavaEE】简单了解JVM_第4张图片 

✨这个引用计数的方法存在两个缺陷。

  1. 浪费内存空间,空间利用率不高,引用计数占用内存空间。
  2. 存在循环引用的情况 ,会导致引用计数的判断逻辑出错

1.1.1、循环引用 

当new了两个对象,正常情况下两个对象的引用各自指向引用的对象,但是这个两个对象中的成员变量相互指向对方对象,这个时候,两个对象中的计数器在各自加1.

【JavaEE】简单了解JVM_第5张图片

 这个时候,t和t1不在指向之前的引用,两个对象的引用计数都减1,但是这两个对象的引用计数并没有被清空,实际上这两个对象已经不被使用了,但是无法被当作垃圾,无法释放。这两个对象也无法再次被使用,想要使用一个对象,就需要找到另一个对象,这就在逻辑上形成了循环。

1.2、可达性分析(被Java采用)

把对象之间的引用关系理解成了一个树形结构,从一些特殊的起点出发,进行遍历,只要能遍历访问到的对象,就是"可达的",再把"不可达的"当作垃圾即可。

【JavaEE】简单了解JVM_第6张图片

 ✨可达性分析的关键要点,进行上述遍历,需要有"起点"被称为gcroots

  1. 栈上的局部变量(每个栈的每个局部变量,都是起点)
  2. 常量池中引用的对象
  3. 方法区中,静态成员引用的对象

可达性分析,总的来所,就是从所有的gcroots的起点出发,看看该对象里又通过引用能访问那些对象,依次遍历,把所有可以访问的对象都给遍历一遍(遍历的同时把对象标记成"可达"),剩下的遍历不到的对象就是"不可达".

可达性分析的特点:可达性分析克服了引用计数的两个缺点,但是也有自己的问题

  1. 消耗的时间更多,因此某个对象成了垃圾,也不一定能第一时间发现,因为扫描的过程,需要消耗时间
  2. 在进行可达性分析的时候,依次遍历,一旦这个过程中,当前代码中的对象引用关系发生了变化,这就会使情况变得更加复杂。比如,当一个对象指向下一个对象,刚遍历完这个对象,这个对象的引用变了。因此,我们为了更准确的遍历,需要让其他的业务线程暂停工作(STW问题)。

2、释放内存 

这里存在三个典型的策略:

  1. 标记清除
  2. 复制算法
  3. 标记整理
  4. 分代回收

前三种释放内存的方式都存在一定的缺点,所以实际上JVM的实现思路,是结合了上述的几种思想方法。

2.1、标记清除

这种策略,就是直接把垃圾对象的内存释放,但是这个方式的缺点就是会产生内存碎片。

【JavaEE】简单了解JVM_第7张图片

我们从内存中申请空间的时候,都是整块的连续的空间,现在这里空闲的空间是离散的,独立的空间,总的空间可能很大。假如总的空闲的空间可能超过了1G,但是你想申请500MB可能都不一定申请到。

2.2、复制算法

为了解决内存碎片的问题,又引入了复制算法。复制算法,十八整个内存空间,分成两半,一次只用一半。

【JavaEE】简单了解JVM_第8张图片

 复制算法解决了内存碎片化的问题,但是也有缺点

  1. 内存利用率比较低
  2. 如果当前的对象大部分都是要留的,垃圾很少,此时复制成本就比较高

2.3、标记整理 

【JavaEE】简单了解JVM_第9张图片

 这个方法,也可以结局内存碎片化的问题,但是他的搬运开销还是比较大的。

2.4、分代回收

针对不同的情况,使用不同的策略。给对象设定"年龄"这样的概念(当然这个单位并不是年龄,这里用年龄作为类比),描述了这个对象存在多久了,如果一个对象刚创建,认为是0岁,没经过一轮扫描(可达性分析),没有被标记成垃圾,这个时候对象就涨一岁,通过这个年龄来区分这个对象的存活时间。

根据年龄的大小来区分采用什么样的策略 

【JavaEE】简单了解JVM_第10张图片 

  1. 新城建的对象,放到伊甸区,当垃圾回收扫描到伊甸区之后,绝大部分对象都会在第一轮GC中被回收
  2. 如果伊甸区的对象,在第一轮的GC中没有被回收,就会通过复制算法,拷贝到幸存区,幸存区分成了大小均等的两部分,一次只使用其中的一半。垃圾回收扫描幸存区的对象,发现垃圾,通过复制算法,将不是垃圾的对象复制到生存区的另一半空间中,然后将前一半的空间全部释放。
  3. 当这个对象在生存区,经过了若干轮GC之后,年龄增长到一定的程度,就会通过复制算法拷贝到到年代。
  4. 进入老年代的对象,年龄都很大了,在消亡的概率就比前面的新生代中的对象小了很多,针对老年代GC的扫描频次就会降低很多。如果老年代中出现了垃圾对象,就会使用标记整理的算法进行清理,因为老年代中消亡的对象就很少了,所以使用标记整理的算法开销还不是很大。
  5. 特殊情况:如果对象非常大,直接进入老年代(大对象进行复制算法,成本比较高,而且大对象也不是很多)

根据经验规律:如果一个对象存活的时间很长了,他将继续存在更长的时间。

你可能感兴趣的:(JavaEE,java-ee,jvm,java)