您的位置:首页 >Java日志在CentOS上如何进行故障排查
发布于2026-05-02 阅读(0)
扫一扫,手机访问

排查的第一步,永远是找到对的日志。别急着翻代码,先按图索骥,把几个关键的日志来源摸清楚。
logs/ 文件夹里,或者由配置文件(比如 logback.xml)指定路径。拿到路径后,几个命令行工具能帮你快速定位问题:
cat、方便浏览的 less,或者实时追踪最新内容的 tail -f /path/to/app.log。grep -n “ERROR|Exception” /path/to/app.log 把“坏家伙”揪出来,-n 参数还能告诉你它在第几行。journalctl -u your-app.service 这个命令就至关重要了。它能清晰展示服务的标准输出和启动失败的具体原因。此外,系统级的全局日志 /var/log/messages 或 /var/log/syslog 也值得一看,或许记录了相关的资源或权限问题。hs_err_pid.log 的文件。这份文件堪称“验尸报告”,里面包含了导致崩溃的信号、CPU寄存器状态、所有线程的堆栈信息以及JVM版本详情,是定位JNI调用错误、本地库崩溃或内存访问违规问题的首要线索。知道了日志在哪,接下来就是面对各种具体场景。下面这几种情况,相信运维同学都不会陌生。
log4j.properties)确实在应用的 classpath 下(例如 src/main/resources),并且路径和文件名完全正确。别忘了检查应用进程是否有读取该配置文件的权限。ja va -Dlog4j.configuration=file:/path/to/log4j.properties -jar app.jarja va -Dlogback.configurationFile=/path/to/logback.xml -jar app.jarrootLogger 或 临时调整为 DEBUG 级别,如果能看到详细输出,就证明配置生效了。排查完毕后,记得收敛回适合生产环境的 INFO/WARN/ERROR 级别。hs_err_pid*.log 文件。根据其中的错误类型(如 SIGSEGV),可以初步判断是JNI代码、本地库、硬件问题还是JVM自身的Bug。常见的应对策略包括升级JDK版本、回退有问题的本地库,或者调整GC及堆内存参数。jstat -gc 观察垃圾回收的实时趋势,重点关注 Young GC / Full GC 的频率,以及 Eden、Survivor、Old 区的使用率变化。jmap -dump:format=b,file=heap.hprof 导出堆内存转储文件。然后用 Eclipse MAT 或类似的工具打开,分析哪些对象占用了大量内存,并顺着引用链找到“谁”还在持有这些本该被回收的对象。临时缓解方案可以适当调大 -Xmx/-Xms 参数,但根本解决之道在于优化对象生命周期和缓存策略。top 或 htop 宏观查看系统CPU、内存、I/O压力。使用 pidstat -u -p 可以更聚焦地观察目标进程的CPU使用情况。JA VA_HOME 和 PATH 变量是否正确指向了预期的JDK版本?不同版本JDK的行为差异有时会带来意想不到的问题。为了方便查阅,这里将关键命令整理成一份清单,遇到问题可以按图索骥。
ps -ef | grep ja va (找Ja va进程)
top/htop (看系统资源)
pidstat -u -p (查进程CPU)
free -m (看内存)
df -h (看磁盘)jstat -gc (GC状态)
jmap -dump:format=b,file=heap.hprof (堆转储)
jstack > threads.txt (线程快照)tail -f app.log | grep -i error (实时过滤错误)
journalctl -u your-app.service -b (查看本次启动日志)
less hs_err_pid*.log (分析崩溃日志)
cat /var/log/messages | tail -n 200 (查看最近系统消息)hs_err_pid*.log 时,重点聚焦 “Problematic frame”(问题帧)、“Stack Trace”(堆栈跟踪)和 “Signal”(信号)这几个关键段落,它们能帮你快速定位问题是出在JVM内部、JNI调用还是本地库。最好的故障排查,是让故障不发生。良好的日志治理习惯能防患于未然。
logrotate 工具进行自动轮转和清理。一个典型的配置示例(放在 /etc/logrotate.d/your-app)如下:
/path/to/app.log {
daily
missingok
rotate 7
compress
notifempty
create 640 root root
}
这个配置意味着:每天轮转一次,允许日志文件缺失,保留最近7份,对旧日志进行压缩,空文件不轮转,新创建的日志文件权限为640。systemctl restart your-app-service 来安全重启服务生效。记住,DEBUG级别日志仅用于短期排查,生产环境应以INFO、WARN、ERROR为主,并可考虑结合采样或异步日志来降低I/O开销。当应用规模扩大后,引入ELK(Elasticsearch, Logstash, Kibana)或Graylog等日志集中化平台,能极大地提升日志的收集、检索和告警效率,让运维工作变得更主动。
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9