您的位置:首页 >CentOS Java故障排查有哪些技巧
发布于2026-05-02 阅读(0)
扫一扫,手机访问

在 CentOS 上处理 Ja va 应用的“疑难杂症”,最怕的就是毫无头绪。其实,只要遵循一套清晰的排查路径,大多数问题都能迎刃而解。下面这份从系统到 JVM 的实战指南,或许能帮你快速定位问题核心。
当问题发生时,别急着深入代码,先从外围环境入手,往往能事半功倍。
ja va -version 和 ja vac -version,确认运行时和编译器版本是否匹配。用 which ja va 找到命令位置,再用 readlink -f $(which ja va) 看看它最终指向哪里,避免被软链接“欺骗”。如果系统装了多个版本,alternatives --config ja va 可以帮你切换。最后,检查环境变量 echo $JA VA_HOME 和 echo $PATH,确保设置正确且在 /etc/profile 或 /etc/bashrc 中生效(别忘了 source 一下)。ps -ef | grep ja va 或更直接的 jps 获取进程 PID。接着,用 top -H -p (记得按 Shift+H 显示线程)或 pidstat -u -p 1 观察线程级的 CPU 消耗。系统层面也别放过,vmstat 1、iostat -x 1、sar -n DEV 1 这些命令能帮你快速判断是否存在 CPU、内存、磁盘 I/O 或网络瓶颈。ss -lntp | grep :端口 或 netstat -tulpen | grep :端口 查一下,然后决定是干掉占用进程,还是给应用换个端口。systemctl status 能看状态,而 journalctl -u -xe 则是查看启动失败详细日志的利器。日志是故障的“自白书”,读懂它,问题就解决了一半。
application.log 或 Tomcat 的 catalina.out。用 tail -f 实时跟踪,用 grep -n “ERROR” 快速过滤关键错误。对于 Spring Boot 应用,可以在 application.properties 里通过 logging.file.name 指定日志路径,方便管理。hs_err_pid*.log 文件。重点看开头的“信号”(如 SIGSEGV)、“Problematic frame”以及 JRE/VM 版本信息,这能帮你判断是不是 JNI 调用、非法内存访问或 JVM 自身的 Bug 导致的。/var/log/messages 或 /var/log/syslog,里面可能记录了 OOM Killer 杀进程、磁盘写满、权限不足等系统级问题。如果系统启用了 ABRT(自动错误报告工具),还可以用 abrt-cli 查看更详细的崩溃报告。进入 JVM 内部,问题通常集中在线程、内存和垃圾回收上。
jstack 是首选。加上 -l 选项可以查看锁信息,直接揪出死锁。对于高 CPU 线程,先用 top -H 拿到其十六进制的 nid,转换成十进制后,再到 jstack 的输出中搜索,就能定位到具体的热点方法。jstat -gc 1000 每隔一秒打印一次 GC 数据,观察 YGC/YGCT(年轻代回收)、FGC/FGCT(Full GC 回收)的次数和时间,以及各内存区的使用率,判断是否存在频繁 Full GC 或对象晋升失败。jmap -dump:format=b,file=heap.hprof 生成堆转储文件。然后借助 Eclipse MAT 或 JProfiler 这样的工具加载分析,查看“支配树”和“泄漏疑点”,通常能快速找到那些“只增不减”的对象。紧急情况下,jmap -histo:live 也能快速看一眼存活对象分布。libjvm.so 或某个 JNI 调用帧,那问题可能出在堆外内存或本地库。这时候要优先排查第三方 native 依赖、JNI 代码,以及容器或虚拟化环境下的内存、线程资源限制。应用根本起不来?按照这个清单一步步核对。
JA VA_HOME 和 PATH 设置正确,ja va 和 ja vac 版本一致。同时,检查应用与 JDK 的版本、位数(32/64位)是否兼容。ss 或 netstat 命令找到占用者,然后决定是终止它还是修改应用配置。-cp 或 -classpath 是否正确。对于可执行 JAR,用 jar tf app.jar 确认主类(Main-Class)确实存在。Ma ven/Gradle 项目则要确保所有依赖都已正确下载和引入。catalina.sh)中的 JA VA_OPTS、堆内存参数(-Xmx, -Xms)、GC 策略以及各类文件路径。特别注意脚本里有没有错误地覆盖了 JA VA_HOME 变量。ja va -jar app.jar,观察完整的控制台输出。错误信息往往一目了然,修复后再交还给 systemd 托管。最后,为了应对紧急情况,这里有一份“对症下药”的速查表,帮你快速反应。
| 症状 | 优先命令 | 关键检查点 | 常见修复 |
|---|---|---|---|
| 端口被占用 | ss -lntp | grep :端口 | 占用进程 PID、启动用户 | kill |
| Ja va 未找到 | which ja va; readlink -f $(which ja va); alternatives --config ja va | JA VA_HOME、PATH、多版本冲突 | 正确设置 JA VA_HOME/PATH,切换 alternatives |
| 启动即退出 | tail -f logs/*.log; systemctl status |
应用日志报错、配置错误 | 修正配置、依赖与权限 |
| CPU 飙高 | top -H -p |
热点线程、锁竞争 | 优化代码/锁、减少阻塞 |
| 频繁 Full GC | jstat -gc |
FGC/FGCT 增长、晋升失败 | 增大堆 -Xmx/-Xms、调优 GC |
| OOM | jmap -dump; MAT | 泄漏对象、支配树 | 修复泄漏、调整对象生命周期 |
| JVM 崩溃 | hs_err_pid*.log | 信号、Problematic frame | 排查 JNI、升级 JDK/内核 |
| 磁盘写满 | df -h; du -sh /var/log /opt | 日志/堆转储占满 | 清理旧日志、配置 logrotate、转移 dump 路径 |
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9