mdadm 故障修复教程:排查与解决 RAID 问题 🔧
1. RAID 常见故障类型
RAID 阵列可能遇到以下常见问题:
- RAID 阵列降级(Degraded):一个或多个磁盘失效。
- RAID 阵列不可用(Inactive):RAID 配置损坏或未正确组装。
- RAID 阵列崩溃:多个磁盘失效,数据不可恢复。
2. 检查 RAID 状态
2.1 使用 cat /proc/mdstat
cat /proc/mdstat
输出示例(降级阵列):
md0 : active raid1 sdb[1]
1048576 blocks [2/1] [U_]
2.2 查看详细信息
sudo mdadm --detail /dev/md0
输出示例:
/dev/md0:
State : clean, degraded
3. 修复降级的 RAID 阵列
3.1 标记故障磁盘
如果 RAID 阵列中有故障磁盘,首先标记该磁盘为故障:
sudo mdadm --fail /dev/md0 /dev/sdc
3.2 移除故障磁盘
sudo mdadm --remove /dev/md0 /dev/sdc
3.3 替换磁盘并添加到阵列
将新的磁盘添加到阵列中:
sudo mdadm --add /dev/md0 /dev/sdc
3.4 自动重建
RAID 阵列会自动开始重建,使用以下命令查看进度:
cat /proc/mdstat
4. 重建 RAID 阵列
4.1 阵列未启动(Inactive)
如果 RAID 阵列状态为 inactive
,可以尝试重新组装:
sudo mdadm --assemble --scan