深入理解Class---常量池
一、概念
1、jvm生命周期
启动
:当启动一个java程序时,一个jvm实例就诞生了,任何一个拥有main
方法的class都可以作为jvm实例运行的起点。
运行
:main()函数作为程序初始线程起点,其它线程由该线程启动,包括守护线程(daemon)和non-daemon(普通线程)。守护线程是JVM自己使用的线程比如GC线程就是个守护线程,只要这个jvm实例还有普通线程执行,就不会停止,但是可以用exit()强制终止程序。
消亡
:所有非守护线程退出时,JVM实例结束生命,若安全管理器允许,程序也可以使用java.lang.Runtime类或者System.exit(0)来退出。实际上exit也是用到Runtime类来退出,Runtime是个神奇的类,它还可以用于启动和关闭非java进程。
2、JVM与Class文件
我们一直说java虚拟机实现的与语言是无关的
,java虚拟机不和包含java在内的任何语言绑定,它只和与class文件
这种特殊的二进制文件格式所关联,class文件中包含了java虚拟机指令集
和符号表
以及若干其他辅助信息。基于安全方面的考虑, Java 虑拟机规范要求在 Class 文件中使用许多强制性的语法和结构化约束
,但任一门功能性语言都可以表示为一个能被 Java 虚拟机所接受的有效的 Class 文件。作为一个通用的、机器无关的执行平台,任何其他语言的实现者都可以将 Java 虚拟机作为语言的产品交付媒介。例如,使用 Java 编译器可以把 Java 代码编译为存储字节码的 Class 文件,使用 JRuby 等其他语言的编译器同样可以把程序代码编译成 Class 文件,虚拟机并不关心Class 的来源是何种语言,如图。
3、什么是Class文件
Java字节码类文件(.class)是Java编译器编译Java源文件(.java)产生的“目标文件”。它是一种8位字节的二进制流文件, 各个数据项按顺序紧密的从前向后排列, 相邻的项之间没有间隙, 这样可以使得class文件非常紧凑, 体积轻巧, 可以被JVM快速的加载至内存, 并且占据较少的内存空间(方便于网络的传输)。
class文件是一组以8位字节为基础单位的二进制流。
class文件中的信息是一项一项排列的, 每项数据都有它的固定长度, 有的占一个字节, 有的占两个字节, 还有的占四个字节或8个字节, 数据项的不同长度分别用u1, u2, u4, u8表示, 分别表示一种数据项在class文件中占据一个字节, 两个字节, 4个字节和8个字节。
4、什么是魔数
当我们把class文件转成16进制,我们可以看到文件的头四个字节是cafe babe
,这个就称为魔数
。,它唯一作用就告诉虚拟机当前的文件就是class文件。
使用魔数而不是用扩展名来进行识别主要是基于安全考虑,因为扩展名我们可以随意通过重命名等方式改动。而通过魔数就算你把结尾改成.clss。但它同样还能在JVM运行,因为它的头部还是cafe babe
没变。
很多文件存储标准中都用魔数进行身份标识,如图片gif,jpeg都在文件头部中存储着魔数。
5、jvm常量池
我先讲下概念,接下来我会将class文件转为16进制流后,在举例说明。
常量池中每一项常量都是一个表,jdk1.8有14种结构不同的表结构,这14个表有个共同特点,就是表开始的第一位都是一个u1类型的标志位,JVM根据这个标志位[tag]来确定某个常量池项表示什么类型的字面量,比如tag为1就是指CONSTANT_utf8_info
再看常量池类型表:
这14种常量项结构还有一个特点是,其中13表占用得字节固定,只有CONSTANT_Utf8_info占用字节不固定
,其大小由length决定。为什么呢?因为从常量池存放的内容可知,其存放的是字面量和符号引用,最终这些内容都会是一个字符串,
这些字符串的大小是在编写程序时才确定,比如你定义一个类,类名可以取长取短,所以在没编译前,无法确定大小不固定,编译后,通过utf-8编码,就可以知道其长度。
在看每一项常量表对应的说明:
二、16进制class文件解析
先看java代码
package com.jincou.demo.domain;
public class XiaoXiao {
private String father;
public String fatherName() {
return "小小她爹";
}
}
通过命令自动生成class文件(会在同一目录生成)
javac XiaoXiao.java
在将class文件拖入文本编辑器里,显示自然就是16进制流了,如下:
上面的表其实可以划分为以下七个部分,.class 字节码文件包括:
- 魔数与class文件版本
- 常量池
- 访问标志
- 类索引、父类索引、接口索引
- 字段表集合
- 方法表集合
- 属性表集合
这篇博客只讲到常量池,其它的下篇讲,接下来我们一行一行解释,首先是:
cafe babe
:上面说过了这个是魔数,告诉JVM虚拟机我就是class文件。
0000 0034
:次版本号组成u2+主版本号u2。共占4个字节。0034转10进制为52,代表当前JDK版本为1.8。
0013
:说明有19-1即18个常量。
上面这些位置是固定的。接下来就是说明每一个常量:
0a
:这就是tag代表一个标志,0a代表10,去找常量池列表。
得知它是一个接口中方法的符号引用,然后去找CONSTANT_Methodref_info
对应常量列表描述:
从常量列表我们可以知道该类型一共占了5u,即0a00 0400 0f
,那么下一个tag就是08
代表字符串类型常量,以此类推就可以知道一共18个常量的信息。
三、class反编译
通过上面看16进制的却太麻烦了,现在我们可以通过JDK自带反编译工具查看会更加清晰。
javap -verbose 文件名
通过反编译看去就很直观,比如第一个字符常量很明显告诉你是CONSTANT_Methodref_info
,而且对于的就是4和15和上面完美对应。
最后思考,到底哪些会放到常量池?
1.常量池可以理解为class文件中的资源仓库,有很多种类型,主要存放两大常量
①.字面量
字面量就是通俗理解的java常量,如文本字符串,8大基本数据类型,final修饰的常量值等
②.符号引用
符号引用属于编译原理的概念,主要包含以下三种
1)类和接口的全限定名
2)字段的名称和描述符
3)方法的名称和描述符
参考
1、深入了解java虚拟机第2版第六章
2、深入理解JVM-Class文件结构和类加载
3、深入理解JVM之Java字节码(.class)文件详解
只要自己变优秀了,其他的事情才会跟着好起来(少将3)