详细结构
如果自己想手写一个Java虚拟机的话,主要考虑哪些结构呢?
类加载器子系统负责从文件系统或者网络中加载Class文件,class文件在文件开头有特定的文件标识。
ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine执行引擎决定。
加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
DNA元数据模板
,放在方法区。目的在于确保Class文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。
主要包括四种验证,文件格式验证
,元数据验证
,字节码验证
,符号引用验证
。
安装Binary Viewer,将.class
文件拖入该软件
发现所有.class
文件的开头都是以CA FE BA BE开头的,这也是初步校验
安装
使用
效果
为类变量分配内存并且设置该类变量的默认初始值,即零值。
这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化;
这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
public class HelloApp {
private static int a = 1; // 准备阶段为0,在下个阶段,也就是初始化的时候才是1
public static void main(String[] args) {
System.out.println(a);
}
}
将常量池内的符号引用转换为直接引用的过程。
事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行。
符号引用
就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。直接引用
就是直接指向目标的指针、相对偏移量
或一个间接定位
到目标的句柄
。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT Class info、CONSTANT Fieldref info、CONSTANT Methodref info等
初始化阶段就是执行类构造器方法
的过程。(class init简写)
此方法不需定义,是javac编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。
构造器方法中指令按语句在源文件中出现的顺序执行。(报错:非法的前向引用)
public class ClassInitTest {
private static int num = 1;
static{
num = 2;
number = 20;
System.out.println(num);
//System.out.println(number);//报错:非法的前向引用。(构造器方法中指令按语句在源文件中出现的顺序执行)
}
private static int number = 10; //linking之prepare: number = 0 --> initial: 20 --> 10
public static void main(String[] args) {
System.out.println(ClassInitTest.num);//2
System.out.println(ClassInitTest.number);//10
}
}
不同于类的构造器。(关联:构造器是虚拟机视角下的
)若该类具有父类,JVM会保证子类的
执行前,父类的
已经执行完毕。
任何一个类在声明后,都有生成一个构造器,默认是空参构造器
关于涉及到父类时候的变量赋值过程
public class ClinitTest1 {
static class Father{
public static int A = 1;
static{
A = 2;
}
}
static class Son extends Father{
public static int B = A;
}
public static void main(String[] args) {
//先加载Father类,其次加载Son类。
System.out.println(Son.B);//2
}
}
我们输出结果为 2,也就是说首先加载ClinitTest1的时候,会找到main方法,然后执行Son的初始化,但是Son继承了Father,因此还需要执行Father的初始化,同时将A赋值为2。我们通过反编译得到Father的加载过程,首先我们看到原来的值被赋值成1,然后又被复制成2,最后返回
0 iconst_1
1 putstatic #2
4 iconst_2
5 putstatic #2
8 return
虚拟机必须保证一个类的
方法在多线程下被同步加锁。
public class DeadThreadTest {
public static void main(String[] args) {
Runnable r = () -> {
System.out.println(Thread.currentThread().getName() + "开始");
DeadThread dead = new DeadThread();
System.out.println(Thread.currentThread().getName() + "结束");
};
Thread t1 = new Thread(r,"线程1");
Thread t2 = new Thread(r,"线程2");
t1.start();
t2.start();
}
}
class DeadThread{
static{
if(true){
System.out.println(Thread.currentThread().getName() + "初始化当前类");
while(true){
}
}
}
}
上面的代码,输出结果为
线程1开始
线程2开始
线程1初始化当前类
从上面的结果可以看出该类只有线程一完成了初始化(为了保证同一个类只会被初始化一次)
JVM支持两种类型的类加载器,分别为引导类加载器(Bootstrap ClassLoader)
和自定义类加载器(User-Defined classLoader)
。
从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类的类加载器,但是Java虚拟机规范却没有这么定义,而是将所有派生于抽象类classLoader的类加载器都划分为自定义类加载器。
无论类加载器的类型如何划分,在程序中我们最常见的类加载器始终只有3个,如下所示:
继承树:
ClassLoader类,它是一个抽象类,其后所有的类加载器都继承自classLoader(不包括启动类加载器)
public class ClassLoaderTest {
public static void main(String[] args) {
//获取系统类加载器
ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
System.out.println(systemClassLoader);//sun.misc.Launcher$AppClassLoader@18b4aac2
//获取其上层:扩展类加载器
ClassLoader extClassLoader = systemClassLoader.getParent();
System.out.println(extClassLoader);//sun.misc.Launcher$ExtClassLoader@1540e19d
//获取其上层:获取不到引导类加载器
ClassLoader bootstrapClassLoader = extClassLoader.getParent();
System.out.println(bootstrapClassLoader);//null
//对于用户自定义类来说:默认使用系统类加载器进行加载
ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
System.out.println(classLoader);//sun.misc.Launcher$AppClassLoader@18b4aac2
//String类使用引导类加载器进行加载的。---> Java的核心类库都是使用引导类加载器进行加载的。
ClassLoader classLoader1 = String.class.getClassLoader();
System.out.println(classLoader1);//null
}
}
得到的结果,从结果可以看出 根加载器无法直接通过代码获取,同时目前用户代码所使用的加载器为系统类加载器。同时我们通过获取String类型的加载器,发现是null,那么说明String类型是通过根加载器进行加载的,也就是说Java的核心类库都是使用根加载器进行加载的。
sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@1b6d3586
null
sun.misc.Launcher$AppClassLoader@18b4aac2
null
父类加载器为启动类加载器
如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载
。父类加载器为扩展类加载器
在Java的日常应用程序开发中,类的加载几乎是由上述3种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。
为什么要自定义类加载器?
隔离加载类
在某个应用中需要使用中间件,这个中间件有自己的依赖的jar包,在同一个工程里面,如果引用多个框架的话,有可能会出现某些类的路径一样、类名也相同,这样就会出现类的冲突了,这个时候就需要做一个类的仲裁,像现在主流的容器类的框架一样,它们都会自定义类的加载器,实现不同的中间件隔离,避免类的冲突.
修改类加载的方式
在整个类的加载过程中,bootstrap引导类加载器是一定被使用的,用来加载系统需要的核心API,除了bootstrap引导类加载器之外,其他的类加载器也不是必须的,我们可以根据实际情况中修改类的加载方式,具体要用的时候我们再引用
扩展加载源
加载的类除了可以在网络、本地物理磁盘、jar包去加载之外,我们还可以考虑通过数据库、电视机的机顶盒等等来扩展加载源
防止源码泄漏
当有了字节码文件和反编译的手段,java代码是很容易被编译和篡改,所以,为了防止编译和篡改,我们可以对字节码文件进行加密,当我们需要运行这个字节码文件时候,我们需要解密来还原成内存中的类,而这个解密的操作,就需要自定义类的加载器来实现
public class ClassLoaderTest2 {
public static void main(String[] args) {
try {
//1.获取当前ClassLoader:clazz.getClassLoader()
ClassLoader classLoader = Class.forName("java.lang.String").getClassLoader();
System.out.println(classLoader);
//2.获取当前线程上下文的ClassLoader:Thread.currentThread().getContextClassLoader()
ClassLoader classLoader1 = Thread.currentThread().getContextClassLoader();
System.out.println(classLoader1);
//3.获取系统的ClassLoader:ClassLoader.getSystemClassLoader()
ClassLoader classLoader2 = ClassLoader.getSystemClassLoader().getParent();
System.out.println(classLoader2);
//4.获取调用者的ClassLoader:DriverManager.getCallerClassLoader()
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
}
Java虚拟机对class文件采用的是按需加载
的方式,也就是说当需要使用该类时才会将它的class文件加载到内存生成class对象。而且加载某个类的class文件时,Java虚拟机采用的是双亲委派模式,即把请求交由父类处理,它是一种任务委派模式。
程序中需要使用spi接口,所以需要加载spi类库。由于spi接口属于java的核心api,所以会委托至引导类加载器才会直接进行加载。
spi是接口,要使用它的实现类,就涉及到了第三方的jar包,需要加载jdbc.jar。需要加载第三方的jar包,不属于核心api,这时候需要系统类加载器进行加载。
这时候会进行反向委派,引导类加载器会委派给扩展类加载器,扩展类加载器会委派给系统类加载器。实际上是由线程上下文加载器加载的,线程上下文加载器是系统类加载器的一种。
这个例子可以看到,接口是由引导类加载器加载的,而具体的实现类是由线程上下文加载器(也就是系统类加载器)加载的。
避免类的重复加载
一旦一个类被父类加载器加载之后,就不会再被委派给子类进行加载。
保护程序安全,防止核心API被随意篡改(核心api都由引导类加载器加载)
自定义类:java.lang.String
package java.lang;
public class String {
//
static{
System.out.println("我是自定义的String类的静态代码块");
}
//错误: 在类 java.lang.String 中找不到 main 方法
public static void main(String[] args) {
System.out.println("hello,String");
}
}
自定义string类,但是在加载自定义String类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包中java\lang\String.class),报错信息说没有main方法,就是因为加载的是rt.jar包中的string类。
自定义类:java.lang.ShkStart(报错:阻止创建 java.lang开头的类)
自定义string类,但是在加载自定义String类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包中java\lang\String.class),报错信息说没有main方法,就是因为加载的是rt.jar包中的string类。这样可以保证对java核心源代码的保护,这就是沙箱安全机制
。
沙箱机制
就是将Java代码限定在虚拟机特定的运行范围中,并且严格限制代码对本地系统资源的访问(cpu、内存、文件系统、网络),防止对本地系统造成的破坏。
在Java中将执行程序分成本地代码
和远程代码
两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱 (Sandbox) 机制。
在JVM中表示两个class对象是否为同一个类存在两个必要条件:
换句话说,在JVM中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的ClassLoader实例对象不同,那么这两个类对象也是不相等的。
JVM必须知道一个类是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么JVM会将这个类加载器的一个引用作为类型信息的一部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的。
Java程序对类的使用方式分为:王动使用和被动使用。
主动使用,又分为七种情况:
创建类的实例
访问某个类或接口的静态变量,或者对该静态变量赋值
调用类的静态方法
反射(比如:Class.forName(“com.atguigu.Test”))
初始化一个类的子类
Java虚拟机启动时被标明为启动类的类
JDK7开始提供的动态语言支持:
java.lang.invoke.MethodHandle实例的解析结果REF getStatic、REF putStatic、REF invokeStatic句柄对应的类没有初始化,则初始化
除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化。