每年大促都要补习JVM调优，今年我都总结到这里了。

3年前 (2022) 程序员胖胖胖虎阿

324 0 0

作者: 西魏陶渊明
博客: https://blog.springlearn.cn/

天下代码一大抄, 抄来抄去有提高, 看你会抄不会抄！

每年大促都要补习JVM调优，今年我都总结到这里了。

示例代码地址

一、JVM内存介绍

我们在学习JVM的内存管理的时候,我们的思维要跳出Java的局限。我们要这么理解。我们写的Java代码，是运行在JVM上的。
如果让你来实现JVM那么。你会怎么处理呢?

公共部分(堆heap)
- Class字节码是公共的,是共享的,所有线程都要认识字节码。
- new的对象是公共的,也是共享的,所有线程要都能认识这些实例对象,能读取到实例的数据。
私有部分 (栈stock)
- Java中每个线程的执行中的代码，及代码中的局部变量等信息是私有的。每个线程之间都要维护一份。
- JVM虚拟栈和本地方法栈。
- 代码是怎么执行的,当然是一行一行执行。那么这一行一行的代码是放在哪里的呢? 是放在栈里面的。Java代码是在JVM来执行的。
  所以这个栈，我们称为JVM虚拟栈。
- JVM中有些方法是调用其他语言实现的, 会使用本地方法栈。
- 那么谁来读取栈里面的数据,来出栈执行呢? 这叫做PC寄存区。

1.1 堆空间

JVM参数配置说明

每年大促都要补习JVM调优，今年我都总结到这里了。

1.1.1 堆上信息

每年大促都要补习JVM调优，今年我都总结到这里了。

new 出来的对象都在堆上。当堆的内存不足，会触发gc。GC策略。

1.1.2 堆的相关配置

配置参数	说明	示例
`-Xmx`	设置最大堆大小。	`-Xmx3550m`，设置JVM最大可用内存为3550 MB。
`-Xms`	设置JVM初始内存。	`-Xms3550m`，设置JVM初始内存为3550 MB。此值建议与`-Xmx`相同，避免每次垃圾回收完成后JVM重新分配内存。
`-Xmn2g`	设置年轻代大小。	`-Xmn2g`，设置年轻代大小为2 GB。整个JVM内存大小=年轻代大小+年老代大小+持久代大小。持久代一般固定大小为64 MB，所以增大年轻代后，将会减小年老代大小。此值对系统性能影响较大，Sun官方推荐配置为整个堆的3/8。
`-XX:NewRatio=n`	设置年轻代和年老代的比值。	`-XX:NewRatio=4`，设置年轻代（包括Eden和两个Survivor区）与年老代的比值（除去持久代）。如果设置为4，那么年轻代与年老代所占比值为1:4，年轻代占整个堆栈的1/5。
`-XX:SurvivorRatio=n`	年轻代中Eden区与两个Survivor区的比值。	`-XX:SurvivorRatio=4`，设置年轻代中Eden区与Survivor区的大小比值。如果设置为4，那么两个Survivor区与一个Eden区的比值为2:4，一个Survivor区占整个年轻代的1/6。
`-XX:MaxPermSize=n`	设置持久代大小。(JDK8以移除)	`-XX:MaxPermSize=16m`，设置持久代大小为16 MB。
`-XX:MaxTenuringThreshold=n`	设置垃圾最大年龄。	`-XX:MaxTenuringThreshold=0`，设置垃圾最大年龄。如果设置为0，那么年轻代对象不经过Survivor区，直接进入年老代。对于年老代比较多的应用，提高了效率。如果将此值设置为较大值，那么年轻代对象会在Survivor区进行多次复制，增加了对象在年轻代的存活时间，增加在年轻代即被回收的概率。

1.1.3 常见问题

大对象，无法释放，导致内存移除。
堆上的问题是比较容易排查的,可以通过工具把堆的信息给dump下来,然后就能直接定位到大对象,并通过调用链路定位到具体的代码,后面会介绍工具

1.2 非堆空间

每年大促都要补习JVM调优，今年我都总结到这里了。

1.2.1 非堆上的信息

每年大促都要补习JVM调优，今年我都总结到这里了。

Thread 配置线程的栈大小，决定了你调用链的深度。
Metaspace 可加载类的信息大小

1.2.2 相关配置

配置参数	说明	示例
`-Xss`	设置线程的栈大小。	`-Xss128k`，设置每个线程的栈大小为128 KB。说明 JDK 5.0版本以后每个线程栈大小为1 MB，JDK 5.0以前版本每个线程栈大小为256 KB。请依据应用的线程所需内存大小进行调整。在相同物理内存下，减小该值可以生成更多的线程。但是操作系统对一个进程内的线程个数有一定的限制，无法无限生成，一般在3000个~5000个。
`-XX:MaxMetaspace=n`	设置元空间大小。	`-XX:MaxMetaspace=16m`，设置元空间大小为16 MB。

二、工具介绍

2.1 原生命令

2.2 二方可视化分析

2.2.1 idea 插件VisualGC

每年大促都要补习JVM调优，今年我都总结到这里了。

2.2.2 JProfile

JProfile

每年大促都要补习JVM调优，今年我都总结到这里了。

2.2.3 Arthas

Arthas

Arthas功能是比较强大的,非常适合用于排查些疑难问题

每年大促都要补习JVM调优，今年我都总结到这里了。

2.3 GC日志学习

开启GC日志参数 -XX:+PrintGCDateStamps -XX:+PrintGCDetails -XX:+PrintGCDateStamps

2.3.1 年轻代GC

首先是年轻代GC

2022-06-03T00:13:48.801-0800: 
0.369: 
[GC (Allocation Failure) 
[PSYoungGen: 7168K->1513K(8704K)] 7168K->4097K(49664K), 0.0183816 secs] 
[Times: user=0.02 sys=0.01, real=0.02 secs]

2022-06-03T00:13:48.801-0800 -XX:+PrintGCDateStamps 打印日期
0.369 -XX:+PrintGCDateStamps JVM启动到当前日期的总时长的时间戳形式
[GC (Allocation Failure) GC 原因(Allocation Failure) 分配失败
- Allocation Failure 分配失败
- Metadata GC Threshold 元空间不足
- Last ditch collection 元空间GC后,仍然不足,即触发
PSYoungGen 年轻代GC
Times 耗时统计
- user 表示GC线程执行所使用的CPU总时间
- sys 进程在内核态消耗的CPU时间
- real 程序从开始到结束所用的时钟时间,这个时间接近 sys + user

由于多核的原因,一般的GC事件中, real time是小于sys + user time的,因为一般是多个线程并发的去做GC,所以real time是要小于systuser time的

2.3.2 老年代GC

老年代执行的是 Full GC，Full GC执行的时候，不止回收老年代，还会回收新生代和元数据空间

2022-06-03T00:22:27.829-0800:
0.798: 
[Full GC (Allocation Failure) 
[PSYoungGen: 0K->0K(8704K)] 
[ParOldGen: 36024K->36006K(40960K)] 36024K->36006K(49664K), 
[Metaspace: 3078K->3078K(1056768K)], 0.2006976 secs] 
[Times: user=1.11 sys=0.01, real=0.21 secs]

2022-06-03T00:13:48.801-0800 -XX:+PrintGCDateStamps 打印日期
0.369 -XX:+PrintGCDateStamps JVM启动到当前日期的总时长的时间戳形式
[Full GC (Allocation Failure) GC 原因(Allocation Failure) 分配失败
- Allocation Failure 分配失败
- Metadata GC Threshold 元空间不足
- Last ditch collection 元空间GC后,仍然不足,即触发
PSYoungGen 年轻代GC
ParOldGen 老年代GC
Metaspace 元空间或者叫方法区GC
Times 耗时统计
- user 表示GC线程执行所使用的CPU总时间
- sys 进程在内核态消耗的CPU时间
- real 程序从开始到结束所用的时钟时间,这个时间接近 sys + user

三、场景分析

3.1 堆空间导致OOM

3.1.1 模拟堆栈

HeapOverflowTest
StackOverflowTest

3.1.2 现象

频繁进行fu gc
应用吞吐量下降
应用rt上升
方法调用报错OutOfMemoryError : Java heap space

3.1.3 解决方案

jps 找到应用 pid
把堆信息dump下来 jmap -dump:format=b,file=heap.hprof ${pid}
打开JProfile 打开文件,直接看到大对象是哪个。

每年大促都要补习JVM调优，今年我都总结到这里了。

3.2 CPU飙升

CPU飙升,可能是有线程一直在占用CPU。发生了死锁，发生了死循环之类的。这些情况是有问题的。
但是当你的机器流量比较大时候,同样也会导致CPU飙升,此时可能就需要加机器来进行解决。或者仅限限流。下面
只说有问题的场景,如何查看线程状态。

3.2.1 模拟异常

public class CPU {

    public static void main(String[] args) {
        for (int i = 0; i < 10; i++) {
            new Thread(() -> {
                while (true) {

                }
            }).start();
        }
    }
}

3.2.2 现象

系统卡顿,吞吐量下降
如果没有限制启动参数,可能会导致宿主机也非常卡段,引用占用了很大CPU

3.2.3 解决方案

找到那些线程在阻塞 jstack $PID
如下片段发现线程都是 BLOCKED 状态, 调用点都在 CPU.java:18

"Thread-497" #508 prio=5 os_prio=31 tid=0x00007f88f58a0000 nid=0x41903 waiting for monitor entry [0x0000000326ea5000]
   java.lang.Thread.State: BLOCKED (on object monitor)
	at java.io.PrintStream.println(PrintStream.java:735)
	- waiting to lock <0x00000007bce02720> (a java.io.PrintStream)
	at learn.jvm.CPU.lambda$main$0(CPU.java:18)
	at learn.jvm.CPU$$Lambda$1/189568618.run(Unknown Source)
	at java.lang.Thread.run(Thread.java:748)

"Thread-496" #507 prio=5 os_prio=31 tid=0x00007f88f589f800 nid=0x41a03 waiting for monitor entry [0x0000000326da2000]
   java.lang.Thread.State: BLOCKED (on object monitor)
	at java.io.PrintStream.println(PrintStream.java:735)
	- waiting to lock <0x00000007bce02720> (a java.io.PrintStream)
	at learn.jvm.CPU.lambda$main$0(CPU.java:18)
	at learn.jvm.CPU$$Lambda$1/189568618.run(Unknown Source)
	at java.lang.Thread.run(Thread.java:748)

"Thread-495" #506 prio=5 os_prio=31 tid=0x00007f8905034000 nid=0x41c03 waiting for monitor entry [0x0000000326c9f000]
   java.lang.Thread.State: BLOCKED (on object monitor)
	at java.io.PrintStream.println(PrintStream.java:735)
	- waiting to lock <0x00000007bce02720> (a java.io.PrintStream)
	at learn.jvm.CPU.lambda$main$0(CPU.java:18)
	at learn.jvm.CPU$$Lambda$1/189568618.run(Unknown Source)
	at java.lang.Thread.run(Thread.java:748)

::: tip Arthas
当然如果你安装了 Arthas

你可以 thread -n 3 打印出最忙的三个线程 thread.
直接输入cpu使用量

thread -b, 找出当前阻塞其他线程的线程
:::

"Thread-8" Id=19 cpuUsage=89.17% deltaTime=188ms time=17319ms RUNNABLE
    at learn.jvm.CPU.lambda$main$0(CPU.java:13)
    at learn.jvm.CPU$$Lambda$1/500977346.run(Unknown Source)
    at java.lang.Thread.run(Thread.java:748)


"Thread-1" Id=12 cpuUsage=85.62% deltaTime=180ms time=17296ms RUNNABLE
    at learn.jvm.CPU.lambda$main$0(CPU.java:13)
    at learn.jvm.CPU$$Lambda$1/500977346.run(Unknown Source)
    at java.lang.Thread.run(Thread.java:748)


"Thread-3" Id=14 cpuUsage=84.42% deltaTime=178ms time=17315ms RUNNABLE
    at learn.jvm.CPU.lambda$main$0(CPU.java:13)
    at learn.jvm.CPU$$Lambda$1/500977346.run(Unknown Source)
    at java.lang.Thread.run(Thread.java:748)

3.3 非堆空间导致OOM

3.3.1 模拟异常

启动参数: -XX:MetaspaceSize=120m -XX:MaxMetaspaceSize=120m -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/Users/liuxin/Github/learn-example/logs/gc.log

public class MetaspaceOverflowTest {

    /**
     * 查看元空间配置
     * java -XX:+PrintFlagsFinal -version | grep Metaspace
     * 方法区是JVM规范。
     * - 永久代和元空间是实现
     * 元空间调优规则:
     * 1. 最大最小设置成一样大
     * 防止内存抖动
     *
     * @param args -XX:MetaspaceSize=20m
     *             -XX:MaxMetaspaceSize=20m
     *             java.lang.OutOfMemoryError-->Metaspace
     */
    public static void main(String[] args) {
//        while (true) {
            Sleeps.sleep(0.2);
            for (int i = 0; i < 200; i++) {
                Enhancer enhancer = new Enhancer();
                enhancer.setSuperclass(MetaspaceOverflowTest.class);
                enhancer.setUseCache(false);
                enhancer.setCallback(new MethodInterceptor() {
                    @Override
                    public Object intercept(Object o, Method method, Object[] objects, MethodProxy methodProxy) throws Throwable {
                        return methodProxy.invokeSuper(objects, args);
                    }
                });
                System.out.println("create InstanceKlass...");
                enhancer.create();
            }
//        }
        while (true);
        //  java.lang.OutOfMemoryError-->Metaspace
    }
}

3.3.2 现象

当你收到运维告警,或者是明显感觉到系统吞吐量下降,甚至会有oom异常的时候,首先先去看下 GC日志，找到GC的原因。下面看下非堆空间溢出导致的GC日志,并配上前面的GC日志学习。来
排查下问题。

CommandLine flags: -XX:CompressedClassSpaceSize=12582912 -XX:InitialHeapSize=268435456 -XX:MaxHeapSize=4294967296 -XX:MaxMetaspaceSize=20971520 -XX:MetaspaceSize=20971520 -XX:+PrintGC -XX:+PrintGCDateStamps -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseParallelGC 
2022-06-20T18:12:26.411-0800: 1.749: [GC (Allocation Failure) [PSYoungGen: 65536K->3006K(76288K)] 65536K->3006K(251392K), 0.0233877 secs] [Times: user=0.06 sys=0.02, real=0.02 secs] 
2022-06-20T18:12:26.960-0800: 2.298: [GC (Allocation Failure) [PSYoungGen: 68542K->3264K(141824K)] 68542K->3272K(316928K), 0.0194187 secs] [Times: user=0.08 sys=0.02, real=0.02 secs] 
2022-06-20T18:12:27.824-0800: 3.162: `[GC (Allocation Failure)` [PSYoungGen: 134336K->5264K(141824K)] 134344K->5280K(316928K), 0.0145565 secs] [Times: user=0.06 sys=0.02, real=0.01 secs] 
2022-06-20T18:12:28.526-0800: 3.864: [GC (Allocation Failure) [PSYoungGen: 136336K->6928K(272896K)] 136352K->6952K(448000K), 0.0198281 secs] [Times: user=0.09 sys=0.03, real=0.02 secs] 
2022-06-20T18:12:29.252-0800: 4.590: [GC (Metadata GC Threshold) [PSYoungGen: 187304K->8848K(272896K)] 187328K->8880K(448000K), 0.0217320 secs] [Times: user=0.10 sys=0.02, real=0.02 secs] 
2022-06-20T18:12:29.274-0800: 4.612: [Full GC (Metadata GC Threshold) [PSYoungGen: 8848K->0K(272896K)] [ParOldGen: 32K->8685K(86016K)] 8880K->8685K(358912K), [Metaspace: 20088K->20088K(1069056K)], 0.0245986 secs] [Times: user=0.10 sys=0.01, real=0.02 secs] 
2022-06-20T18:12:29.299-0800: 4.637: [GC (Last ditch collection) [PSYoungGen: 0K->0K(476160K)] 8685K->8685K(562176K), 0.0005319 secs] [Times: user=0.01 sys=0.00, real=0.01 secs] 
2022-06-20T18:12:29.300-0800: 4.638: [Full GC (Last ditch collection) [PSYoungGen: 0K->0K(476160K)] [ParOldGen: 8685K->3731K(155648K)] 8685K->3731K(631808K), [Metaspace: 20088K->20088K(1069056K)], 0.0187273 secs] [Times: user=0.07 sys=0.01, real=0.01 secs]

从面的GC日志中我们能找到些GC原因,通过前面的学习。我们可以判断出来。

每年大促都要补习JVM调优，今年我都总结到这里了。

属于非堆空间造成的OOM。

3.3.3 解决方案

排查看应用中是否有动态创建Class的地方
添加元空间大小(如果应用配置限制元空间大小,还出现了这样的问题,一般一定是程序中有bug导致)

版权声明：程序员胖胖胖虎阿发表于 2022年9月18日上午1:24。
转载请注明：每年大促都要补习JVM调优，今年我都总结到这里了。 | 胖虎的工具箱-编程导航

java实现Socket客户端向服务端发送信息

程序员胖胖胖虎阿

368

IDEA安装及激活码(IntelliJ IDEA2022 破解教程,激活至2099年)

程序员胖胖胖虎阿

456

7年加工作经验的程序员，从大厂跳槽出来，遭遇了什么？

程序员胖胖胖虎阿

323

Java学习路线总结（书籍、视频推荐篇）

程序员胖胖胖虎阿

365

IDEA最新永久破解方法(IDEA永久破解教程,激活至2099年)

程序员胖胖胖虎阿

195

用SpringBoot实现技术整合，体验SpringBoot的简化开发

程序员胖胖胖虎阿

145

暂无评论

暂无评论...

每年大促都要补习JVM调优，今年我都总结到这里了。

一、JVM内存介绍

1.1 堆空间

1.1.1 堆上信息

1.1.2 堆的相关配置

1.1.3 常见问题

1.2 非堆空间

1.2.1 非堆上的信息

1.2.2 相关配置

二、工具介绍

2.1 原生命令

2.2 二方可视化分析

2.2.1 idea 插件VisualGC

2.2.2 JProfile

2.2.3 Arthas

2.3 GC日志学习

2.3.1 年轻代GC

2.3.2 老年代GC

三、场景分析

3.1 堆空间导致OOM

3.1.1 模拟堆栈

3.1.2 现象

3.1.3 解决方案

3.2 CPU飙升

3.2.1 模拟异常

3.2.2 现象

3.2.3 解决方案

3.3 非堆空间导致OOM

3.3.1 模拟异常

3.3.2 现象

3.3.3 解决方案

IntelliJ IDEA专业版激活码(IDEA永久免费激活码,成功激活)

idea的最新破解方法(windows/mac idea2019破解教程,永久有效)

相关文章

暂无评论

每年大促都要补习JVM调优，今年我都总结到这里了。

一、JVM内存介绍

1.1 堆空间

1.1.1 堆上信息

1.1.2 堆的相关配置

1.1.3 常见问题

1.2 非堆空间

1.2.1 非堆上的信息

1.2.2 相关配置

二、工具介绍

2.1 原生命令

2.2 二方可视化分析

2.2.1 idea 插件VisualGC

2.2.2 JProfile

2.2.3 Arthas

2.3 GC日志学习

2.3.1 年轻代GC

2.3.2 老年代GC

三、场景分析

3.1 堆空间导致OOM

3.1.1 模拟堆栈

3.1.2 现象

3.1.3 解决方案

3.2 CPU飙升

3.2.1 模拟异常

3.2.2 现象

3.2.3 解决方案

3.3 非堆空间导致OOM

3.3.1 模拟异常

3.3.2 现象

3.3.3 解决方案

IntelliJ IDEA专业版 激活码(IDEA永久免费激活码,成功激活)

idea的最新破解方法(windows/mac idea2019破解教程,永久有效)

相关文章

暂无评论

IntelliJ IDEA专业版激活码(IDEA永久免费激活码,成功激活)