您的位置:首页 >CentOS Java如何进行故障恢复
发布于2026-05-01 阅读(0)
扫一扫,手机访问

当Ja va应用在CentOS服务器上突然“罢工”,那种感觉确实让人头疼。别慌,这份手册的目的,就是帮你把那些零散的命令和步骤,梳理成一套清晰、可执行的恢复流程。咱们从最紧急的快速操作开始,一步步深入到稳定保障和深度排查。
故障发生时,时间最关键。按照下面这个顺序来,能帮你最快稳住局面。
ps -ef | grep ja va或jps -l把进程揪出来,拿到关键的进程ID(PID)。top或htop看看CPU和内存是不是爆了。再用netstat -tulpen | grep 端口或更现代的ss -ltnp | grep 端口,检查应用端口是否在正常监听。kill -15 ,让应用有机会做完手头工作再退出。如果它不理会,再用kill -9 这个强制手段。ja va -jar /path/app.jar。但更推荐用服务管理方式,比如systemctl restart myapp,或者运行你准备好的启停脚本,这样更规范。echo $JA VA_HOME和ja va -version,确保Ja va环境没问题。catalina.out,或者Spring Boot的application.log,错误信息十有八九就在里面。手动恢复只是治标,要想治本,得让系统具备“自愈”能力。这才是保障长期稳定的关键。
/etc/systemd/system/下创建一个myapp.service文件。Restart=on-failure(失败时自动重启)RestartSec=5(重启前等5秒)SuccessExitStatus=143(优雅退出也算成功,避免被重启)ExecStart=/usr/bin/ja va -jar /opt/app/app.jar(启动命令)systemctl daemon-reload。systemctl start|stop|restart|status myapp。systemctl enable myapp一下就行。cron定时任务,就能实现基础的巡检和自愈。autostart=true和autorestart=true,它就能帮你统一管理进程、自动重启,还附带日志轮转功能,非常省心。有些问题光重启解决不了,得找到根儿。下面这些场景,你很可能遇到。
jstat -gcutil 看看垃圾回收是不是在拼命工作。OutOfMemoryError,务必让JVM生成Heap Dump文件,然后用Eclipse MAT这样的工具打开,像法医一样分析到底是谁在“泄漏”内存。-Xms和-Xmx(堆内存大小),选个合适的GC算法(比如G1),并且一定要把GC日志打开,这是事后分析的重要依据。top -Hp ,找到是哪个线程把CPU吃满了,记下它的线程ID(十进制)。jstack > stack.log ,把当前所有线程的快照保存下来。然后把刚才那个高CPU线程ID转换成十六进制,去stack.log文件里搜,就能看到它当时卡在执行的哪行代码上了。netstat -tulpen | grep 端口或者新工具ss -ltnp | grep 端口,都能告诉你谁占着端口不放。-Xms/-Xmx参数设置得比实际内存还大、或者Ja va版本跟应用不兼容。free -m看看还剩多少内存;调低堆参数;ja va -version确认版本;必要时检查并正确设置JA VA_HOME和PATH环境变量。/var/log/messages里grep -i ‘killed process’,或者用journalctl查系统日志,如果发现是系统的OOM Killer动的手,日志里会有记录。高手和普通人的区别,往往在于会不会看“案发现场”。这些日志文件,就是故障的第一现场。
hs_err_pid.log 文件,通常在工作目录,或者由-XX:ErrorFile=参数指定。EXCEPTION_ACCESS_VIOLATION、SIGSEGV)、Problematic frame(出问题的代码帧),以及线程和寄存器信息,这些是定位底层崩溃的关键。-XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/path/gc-$(date +%s).log。这样就能得到带时间戳的详细GC日志,对于分析内存和性能问题不可或缺。-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/path/dump-$(date +%s).hprof。这样一旦发生内存溢出,JVM会自动生成堆转储文件然后退出,为我们保留了最宝贵的“内存快照”。catalina.out,Spring Boot看application.log。这里的错误信息通常最直接,反映了应用层的业务逻辑问题。说了这么多,最后给你一个拿来即用的脚本模板。把它保存为myappctl.sh,赋予执行权限,就能用./myappctl.sh start|stop|restart来管理了。
#!/usr/bin/env bash
set -euo pipefail
APP_JAR="/opt/app/app.jar"
LOG_DIR="/var/log/myapp"
PID_FILE="/var/run/myapp.pid"
JA VA="/usr/bin/ja va"
mkdir -p "$LOG_DIR"
start() {
if [ -f "$PID_FILE" ] && kill -0 "$(cat "$PID_FILE")" >/dev/null 2>&1; then
echo "Already running (PID=$(cat $PID_FILE))"
return 0
fi
nohup "$JA VA" -jar "$APP_JAR" >> "$LOG_DIR/run.log" 2>&1 &
echo $! > "$PID_FILE"
echo "Started (PID=$!)"
}
stop() {
if [ -f "$PID_FILE" ]; then
PID=$(cat "$PID_FILE")
kill -15 "$PID" || true
for i in {1..10}; do
kill -0 "$PID" >/dev/null 2>&1 || { rm -f "$PID_FILE"; echo "Stopped"; return 0; }
sleep 1
done
kill -9 "$PID" || true
rm -f "$PID_FILE"
echo "Force stopped"
else
echo "Not running"
fi
}
restart() { stop; start; }
case "${1:-}" in
start|stop|restart) "$1" ;;
*) echo "Usage: $0 {start|stop|restart}" ;;
esac
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9