您的位置:首页 >dmesg日志显示磁盘故障如何修复
发布于2026-04-30 阅读(0)
扫一扫,手机访问

服务器突然变慢,或者文件系统莫名其妙变成只读,这背后十有八九是磁盘在“报警”。别慌,跟着下面这套流程走,你就能像老手一样,快速定位问题并采取正确行动。
第一步,别急着动手,先搞清楚状况。系统内核日志(dmesg)是故障的第一现场,从这里入手最直接。
dmesg | tail -n 100dmesg | grep -iE “error|fail|ata|sd|IO|bad”yum/apt install smartmontoolssmartctl -H /dev/sda (看整体健康状态)smartctl -a /dev/sdamount | grep ‘ro,’。如果发现根分区都变成只读了,这往往是文件系统检测到致命错误后触发的自我保护机制。iostat -dx 1 5。如果看到 await(等待时间)异常飙升,或者 %util(利用率)长时间接近100%,那磁盘要么是异常了,要么就是遇到了性能瓶颈。根据上面收集到的线索,基本可以归入下面几种场景。对症下药,效率最高。
| 场景与 dmesg 特征 | 处理要点 |
|---|---|
| 文件系统只读(EXT4-fs 报“Couldn‘t remount RDWR … unprocessed orphan inode list”) | 首要任务是备份关键数据。然后进入救援模式或单用户模式,对问题分区执行 fsck(例如 fsck -y /dev/mapper/vg0-root)。如果修复失败,可以尝试升级 e2fsck 工具版本后再试。修复完成后,再重新正常挂载。 |
| SMART 健康为 FAILING 或 Reallocated/Pending 不为 0 | 这是硬盘的“病危通知书”。立即安排全量备份,并准备更换新硬盘。如果磁盘在RAID阵列里,请严格按照阵列管理流程,将故障盘踢出并更换重建。 |
| 大量 “Buffer I/O error / I/O error / Unrecovered read error” | 同样,先备份数据。然后卸载该磁盘,运行只读坏道扫描定位问题:badblocks -s -v -o bb.log /dev/sdX。如果发现的坏道极少,可能是逻辑错误,可以在确保数据已备份且磁盘离线的前提下,尝试用 badblocks -w 命令重写扇区来修复。否则,一律视为物理坏道,该隔离就隔离,该换盘就换盘。 |
| “UnrecovData 10B8B BadCRC / READ FPDMA QUEUED / hard resetting link” | 这类错误高概率是链路问题,比如SATA线质量差、电源线松动、背板接触不良或控制器兼容性有问题。优先更换一根高质量的SATA线,检查电源接口和主板接口,更新驱动和固件。排除链路问题后,再重新评估硬盘本体的健康状况。 |
| 根分区无法卸载导致无法 fsck | 系统盘正在使用,自然无法修复。这时需要借助救援模式、LiveCD或专用的救援系统启动,在离线环境下对相应的逻辑卷或分区执行 fsck 操作。 |
无论遇到哪种情况,遵循一个清晰的流程能最大程度避免失误和数据损失。
dmesg、smartctl、mount、iostat 等命令,明确问题到底是文件系统错误,还是磁盘介质/链路故障,并锁定具体的设备或分区(例如 /dev/sda、/dev/mapper/vg0-root)。fsck -y /dev/sdXN;对于ext系列文件系统,也可以用 e2fsck。e2fsck 后再重试。badblocks -s -v -o bb.log /dev/sdXbadblocks -w(注意参数顺序是 END START),修复后再次扫描验证。e2fsck -l bb.log /dev/sdXNrsync 的校验模式,或对比关键文件的校验和)。之后,还需要持续观察一段时间 dmesg 日志和SMART数据趋势,确保问题真正解决。为了方便操作,这里把核心命令再整理一遍:
dmesg | tail -n 100;dmesg | grep -iE “error|fail|ata|sd|IO|bad”mount | grep ‘ro,’;iostat -dx 1 5smartctl -H /dev/sda;smartctl -a /dev/sdafsck -y /dev/sdXN;e2fsck -y /dev/sdXNbadblocks -s -v -o bb.log /dev/sdXbadblocks -s -w /dev/sdX END STARTe2fsck -l bb.log /dev/sdXN最后,必须强调几点。数据修复和坏道重写操作本身就有导致数据丢失的风险。因此,“先备份,后操作”是铁律,尽量在离线环境下进行。对于关键业务系统,如果心里没底,建议请专业人员进行现场评估和操作。尤其要记住:当SMART报告显示FAILING,或者出现不可恢复的读错误时,最稳妥的方案是优先更换磁盘,而不是冒险继续修复。硬盘有价,数据无价。
上一篇:centos下如何配置js日志
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9