优秀的编程知识分享平台

网站首页 > 技术文章 正文

线上问题解决:java内存溢出问题分析,定位及解决

nanyue 2024-10-28 16:41:47 技术文章 4 ℃

上次说了full gc的解决方案,这次说说大家常见的内存溢出问题。


(一)JVM 内存溢出

  • ① 介绍

多多少少会碰到内存溢出(OOM)的场景,但造成OOM的原因却是多种多样。一起分析下。

  • ① 代码解析

-Xmx512m -server -verbose:gc -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=D:\
解析代码OOM内存快照自动保存

import java.util.ArrayList;

// 资源占用过多或者资源未释放,内存溢出

// -Xmx512m -server -verbose:gc -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=D:\
public class OutOfMemoryDemo1 {
 static ArrayList<Object> space = new ArrayList<Object>();

 public static void main(String[] args) throws Exception {
 // 内存泄漏 最终会导致 内存溢出
 for (int i = 0; i < 1000; i++) {
 space.add(new byte[1024 * 1024 * 64]); // 64兆
 Thread.sleep(3000L);
 }
 }
}



  • ② 分析原因流程

很多人在生产环境配置会存在一个问题,配置的话可以配置Xms Xmx,如果服务器本身是8g,内存一样不要全部用完。一定要预留,JVM的内存设置5G,按照规则3分之二,5分之三。为什么不能设置太大,因为JVM自动处理保存这些操作,它也是需要消耗资源的,这是个自动的过程。一旦资源设置太满,如果设置太满可能你整个系统跑的非常的慢,操作系统的需要内存吧,其他软件需要内存吧,JVM全部占完的情况,可能操作系统都登录不上去,SSH这个工具可能都登录不上去,这就相当相当麻烦了,生产环境比较忌讳的。生产环境一般会监控进程和日志的信息,一旦出现都会处理的,在公司内部一般都是有个流程的

  1. 收到告警,开始排查。
  2. 初步判断,拍脑袋(今天有人上线,昨天XX是不是又上新功能了,他可是个坑货啊。)
  3. 保留现场(出问题的机器切掉,所有的请求不要到这台机器上了,关闭这个机器的所有服务路径,没有头绪的情况)
  4. 快速重启(重启大法最好),这个套路不光是网管的方式,其实在软件开发中也是最好的。绝对实用。快速的恢复实用。
  5. 问题的排查:应用程序日志的分析,JVM的日志。
  6. 最后给出解决方案。
  • ③ 提前准备分析内存溢出问题解决

内存溢出后,设置了刚那个命令之后D盘就会生成一个快照,崩溃的时候内存里面到底放了什么东西,JVM挂掉了,需要进行解刨。快照需要打开的。


下载eclipse的分析工具:https://www.eclipse.org/mat/downloads.php





自动进行分析,生成报表


关键字是数组,具体是数组出现的。



上边的工具可以快速分析,比较好用的,直接了当的给出结论,

  • ③ 线上解析准备分析内存溢出问题解决

jmap跟进程IP建立连接,jmap这个命令非常的消耗资源,内存占用也非常高,这也就是需要保留资源的原因,生产环境寸步难行。使用命令一定要活学活用。

  1. jcmd 查看出来对应的PID
    2.jmap -dump:live,formate=b,file=文件名称.hprof -F PID
  • ④ 很多问题,其实可以通过测试Java VisualVM

虽然这个工具有远程功能,但是一般的开发是不允许连接生产环境的机器。为了重现过程。


(二)常用的log,gc工具

内存,操作系统,CPU,系统报错的,每个接口请求的情况。运维工具。

  1. 大众点评开源的cat
  2. zabbix

PS:调优还是报表工具,主要是一些细节,并不会记下来,这么多工具,思路很重要,知道有这个工具可以干这个事情,大概可以分析什么东西,内存的问题,大部分情况都是可以预防,问题定位比较直接,工具也比较多。问题出现不好回复。内存慢慢堆积升高,是可以通过监控工具发现的。宕机之前解决。开发时,

Tags:

最近发表
标签列表