文章目录
- JVM快速入门
-
- JVM的位置
- JVM的体系结构
- 类加载器
- 双亲委派机制
- 沙箱安全机制
- Native
- PC寄存器
- 方法区
- 栈
- 三种JVM
- 堆
- 新生区、老年区
- 永久区
- 堆内存调优
-
- 安装工具
- 使用
- GC
-
- 引用计数法:
- 复制算法
- 标记清除算法
- 标记压缩
- JMM
JVM快速入门
- 请你谈谈你对JVM的理解?java8虚拟机和之前的变化更新?
- 什么是OOM,什么栈溢出StackOverFlowError?怎么分析?
- JVM 的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?
- 谈谈JVM 中,类加载器你的认识?
JVM的位置
JVM的体系结构
类加载器
作用:加载Class文件 ~
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序加载器
双亲委派机制
package java.lang;
public class String {
// 双亲委派机制:安全
// 1. APP--> EXC ---- BOOT (最终执行)
public String toString(){
return "Hello";
}
public static void main(String[] args) {
String s = new String();
System.out.println(s.getClass().getClassLoader());
s.toString();
}
/*
1. 类加载器收到类加载的请求
2. 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
3. 启动类加载器检查是否能够加载当前这个类, 能加载就结束,使用当前的加载器,否则,抛出异常,通知子加载器进行加载
4. 重复步骤 3
Class Not Found ~
null:java调用不到~ C、 C++
Java = C++--
*/
}
JVM中提供了三层的ClassLoader:
-
Bootstrap classLoader:主要负责加载核心的类库(java.lang.*等),构造ExtClassLoader和APPClassLoader。
-
ExtClassLoader:主要负责加载jre/lib/ext目录下的一些扩展的jar。
-
AppClassLoader:主要负责加载应用程序的主函数类
找到 \jre\lib\rt.jar!\java\lang\ClassLoader.class
public Class<?> loadClass(String var1) throws ClassNotFoundException {
return this.loadClass(var1, false);
}
protected Class<?> loadClass(String var1, boolean var2) throws ClassNotFoundException {
synchronized(this.getClassLoadingLock(var1)) {
// 首先,检查是否已经被类加载器加载过
Class var4 = this.findLoadedClass(var1);
if (var4 == null) {
long var5 = System.nanoTime();
try {
// 存在父加载器,递归的交由父加载器
if (this.parent != null) {
var4 = this.parent.loadClass(var1, false);
} else {
// 直到最上面的Bootstrap类加载器
var4 = this.findBootstrapClassOrNull(var1);
}
} catch (ClassNotFoundException var10) {
}
if (var4 == null) {
long var7 = System.nanoTime();
var4 = this.findClass(var1);
PerfCounter.getParentDelegationTime().addTime(var7 - var5);
PerfCounter.getFindClassTime().addElapsedTimeFrom(var7);
PerfCounter.getFindClasses().increment();
}
}
if (var2) {
this.resolveClass(var4);
}
return var4;
}
}
通过源码可以简单理解,
从上图中我们就更容易理解了,当一个.class文件要被加载时。不考虑我们自定义类加载器,首先会在AppClassLoader中检查是否加载过,如果有那就无需再加载了。如果没有,那么会拿到父加载器,然后调用父加载器的loadClass方法。父类中同理也会先检查自己是否已经加载过,如果没有再往上。注意这个类似递归的过程,直到到达Bootstrap classLoader之前,都是在检查是否加载过,并不会选择自己去加载。直到BootstrapClassLoader,已经没有父加载器了,这时候开始考虑自己是否能加载了,如果自己无法加载,会下沉到子加载器去加载,一直到最底层,如果没有任何加载器能加载,就会抛出ClassNotFoundException。
为什么要设计这种机制
这种设计有个好处是,如果有人想替换系统级别的类:String.java。篡改它的实现,在这种机制下这些系统的类已经被Bootstrap classLoader加载过了(为什么?因为当一个类需要加载的时候,最先去尝试加载的就是BootstrapClassLoader),所以其他类加载器并没有机会再去加载,从一定程度上防止了危险代码的植入。
沙箱安全机制
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱是限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序都可以指定沙箱,可以定制安全策略
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对非授信的远程代码在早期的Java实现中,安全依赖于沙箱(Sandbox)机制。如下图所示JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图JDK1.1安全模型
在Java1.2版本中,再次改进了安全机制,增加了代码签名
。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示JDK1.2安全模型
当前最新的安全机制实现,则引入域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示 最新的安全模型(JDK1.6)
组成沙箱的基本组件:
-
字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
-
类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码; //双亲委派机制
- 他守护了被信任的类库边界;
- 它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派。
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问得到内层类,破坏代码就自然无法生效。
- 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
- 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
- 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名 keytools
- 加密
- 鉴别
Native
编写一个多线程启动类
public class Test {
public static void main(String[] args) {
new Thread(()->{
},"my thread name").start();
}
}
点进去看start方法的源码
凡是带了native关键字的,说明java的作用范围达不到,去调用底层C语言的库!
JNI:Java Native Interface (java本地方法接口)
凡是带了native关键字的方法就会进入本地方法栈,其他的就是Java栈;
Native Interface 本地接口
本地接口的作用是融合不同的编程语言为Java所用,它的初衷及时融合C/C++程序,Java在诞生的时候是C/C++横行的时候,想要立足,必须有调用C、C++的程序,于是就在内存中专门开辟了一块区域处理标记为native的代码,它的具体做法是在 Native Method Stack 中登记native方法,在(Execution Engine)执行引擎执行的时候加载Native Libraies。
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java管理系统生产设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service 等等,不多做介绍!
Native Method Stack
它的具体做法是Native Method Stack 中登记native方法,在(Execution Engine)执行引擎执行的时候加载Native Libraies。
PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向像一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
方法区
Method Area 方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享空间;
静态常量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
栈
数据结构
先进后出、后进先出
队列:先进先出
喝多了吐就是栈,吃多了拉就是队列
为什么main()先执行,最后结束
栈:栈内存,主管程序的运行,生命周期和线程同步
线程结束,栈内存也就释放,对于栈来说,不存在垃圾回收问题
一旦线程结束,栈就over
栈:八大基本类型、对象引用、局部变量、实例的方法
栈运行原理:栈帧
栈+堆+方法区:交互关系
三种JVM
- Sun公司 HotSpot
Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)
- BEA
JRockit
- IBM
J9VM
堆
Heap,一个JVM只有一个怼内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放到堆中? 类,方法,常量,变量~,保存我们所有引用类型的真实对象
堆内存中还要细分为三个区域:
- 新生区(伊甸园区) Yong/New
- 老年区 old
- 永久区 Perm
GC 垃圾回收,主要是在伊甸园区和养老区,
假设内存满了,OOM,堆内存不够! java.lang.OutOfMemoryError:Java heap space
在JDK8以后,永久存储区改了个名字(元空间)
新生区、老年区
- 类:诞生和成长的地方,甚至死亡,
- 伊甸园区 所有的对象都是在伊甸园区new出来的
- 幸存区(0,1)
真理:经过研究,99%的对象都是临时对象!
永久区
这个区域常驻内存的。用来存在JDK自身携带的Class对象。Interface元数据,存储的是Java运行时的一些环境或类信息,这个区域不存在垃圾回收!关闭VM虚拟就会释放这个区域的内存
一个启动类,加载了大量的第三方jar包。Tomcat 部署了太多的应用,大量动态生成的反射类,不断的被加载,直到内存满,就会出现OOM
- jdk1.6之前 : 永久代,常量池是在方法区
- jdk1.7 : 永久代,但是慢慢的退化了,去永久代,常量池在堆中
- jdk1.8之后 : 无永久代,常量池在元空间
逻辑上存在:物理上不存在
package com.kuang;
public class Demo {
public static void main(String[] args) {
//返回虚拟机试图使用的最大内存
long max = Runtime.getRuntime().maxMemory();
// 返回jvm的初始化总内存
long total = Runtime.getRuntime().totalMemory();
System.out.println("max="+max+"字节 " + (max/(double)1024/1024) + "MB");
System.out.println("total="+total+"字节 " + (total/(double)1024/1024) + "MB");
// 默认情况下:分配的总内存 是电脑内存的1/4,而初始化的内存:1/64
}
//OOM :
//1. 尝试扩大堆内存看结果
//2. 分析内存,看一下那个地方出现了问题(专业工具)
// -Xms1024m -Xmx1024m -XX:+PrintGCDetails
}
import java.util.Random;
public class Hello {
public static void main(String[] args) {
String str = "kuangshensayjava";
while (true){
str += str + new Random().nextInt(888888888) + new Random().nextInt(999999999);
}
}
}
//-Xms8m -Xmx8m -XX:+PrintGCDetails
在一个项目中,突然出现了OOM故障,那么如何排除错误
- 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
- Debug,一行行分析
MAT,Jprofiler 作用:
- 分析Dump内存文件,快速定位内存泄漏;
- 获得堆中的数据
- 获得大的对象
堆内存调优
安装工具
1、Idea下载插件Jprofiler
2、下载Jprofiler客户端
https://www.ej-technologies.com/download/jprofiler/files
11以下好破解,但12是中文版
L-J11-Everyone#speedzodiac-327a9wrs5dxvz#463a59
A-J11-Everyone#admin-3v7hg353d6idd5#9b4
安装后
3、idea集成Jprofiler
使用
package com.kuang;
import java.util.ArrayList;
// -Xms 设置初始化内存分配大小,1/64
// -Xmx 设置最大分配内存,默认 1/4
// -XX:+PrintGCDetails 打印GC垃圾回收信息
// -XX:+HeapDumpOnOutOfMemoryError oom Dump
//-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
public class Demo03 {
byte[] array = new byte[1*1024*1024];
public static void main(String[] args) {
ArrayList<Object> list = new ArrayList<>();
int count = 0 ;
try{
while (true){
list.add(new Demo03());
count = count +1;
}
}catch (Exception e){
System.out.println("count:"+count);
e.printStackTrace();
}
}
}
发现根目录多了一个文件
双击打开
GC
Garbage Collection:垃圾回收
JVM在进行GC时,并不是对这三葛区域统一回收。大部分时候,回收都是新生代
- 新生代
- 幸存区(from,to)
- 老年区
GC两种分类:轻GC(普通的GC),重GC(全局GC)
题目:
- JVM的内存模型和分区~详细到每个区放什么?
- 堆里面的分区有哪些?Eden,from,to,老年区,说说他们的特点
- GC的算法有哪些?标记清除法,标记压缩,复制算法,引用计数器,怎么用的?
- 轻GC和重GC分别在什么时候发生?
引用计数法:
原理:
顾名思义,此种算法会在每一个对象上记录这个对象被引用的次数,只要有任何一个对象引用了次对象,这个对象的计数器就+1,取消对这个对象的引用时,计数器就-1。任何一个时刻,如果该对象的计数器为0,那么这个对象就是可以回收的。
问题:
此方法简单,无法解决对象相互循环引用的问题。堆内对象的每一次引用赋值和每一次引用清除,都伴随着加减法的操作,会带来一定的性能开销。
复制算法
年轻代中使用的是Minor GC,这种GC算法采用的是复制算法(Copying)。
Minor GC会把Eden中的所有活的对象都移到Survivor区域中,如果Survivor区中放不下,那么剩下的活的对象就被移到Old generation中,也即一旦收集后,Eden是就变成空的了。
当对象在 Eden ( 包括一个 Survivor 区域,这里假设是 from 区域 ) 出生后,在经过一次 Minor GC 后,如果对象还存活,并且能够被另外一块 Survivor 区域所容纳( 上面已经假设为 from 区域,这里应为 to 区域,即 to 区域有足够的内存空间来存储 Eden 和 from 区域中存活的对象 ),则使用复制算法将这些仍然还存活的对象复制到另外一块 Survivor 区域 ( 即 to 区域 ) 中,然后清理所使用过的 Eden 以及 Survivor 区域 ( 即 from 区域 ),并且将这些对象的年龄设置为1,以后对象在 Survivor 区每熬过一次 Minor GC,就将对象的年龄 + 1,当对象的年龄达到某个值时 ( 默认是 15 岁,通过-XX:MaxTenuringThreshold 来设定参数),这些对象就会成为老年代。
- 好处:没有内存的碎片
- 坏处:浪费了内存空间:多了一半空间永远是空 to。假设对象100%存活(极端)。
复制算法最佳使用场景:对象存活度较低的时候;新生区~
标记清除算法
- 优点:不需要额外的空间
- 缺点:两次扫描,严重浪费时间,会产生内存碎片。
标记压缩
再优化:
内存效率:复制算法>标记清除算法>标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法
思考一个问题:难道没有最优算法吗?
答案:没有,没有最好的算法,只有最合适的算法 -------> GC:分代收集算法
年轻代:
- 存活率低
- 复制算法
老年代:
- 区域大:存活率高
- 标记清除(内存碎片不是太多) + 标记压缩混合 实现
JMM
1、什么是JMM
JMM:Java Memory Mode
2、JMM是干嘛的
作用:缓存了一致性协议,用于定义数据都写的规则(遵守,找到这个规则)
JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)
解决共享对象可见性这个问题:Voliate
3、如何学习
JMM:抽象的概念,理论
JMM对这八种指令的使用,制定了如下规则:
- 不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write
- 不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
- 不允许一个线程将没有assign的数据从工作内存同步回主内存
- 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是怼变量实施use、store操作之前,必须经过assign和load操作
- 一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
- 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
- 对一个变量进行unlock操作之前,必须把此变量同步回主内存
JMM对这八种操作规则和对volatile的一些特殊规则就能确定哪里操作是线程安全,哪些操作是线程不安全的了。但是这些规则实在复杂,很难在实践中直接分析。所以一般我们也不会通过上述规则进行分析。更多的时候,使用java的happen-before规则来进行分析。