mdadm 故障修复教程:排查与解决 RAID 问题 🔧
1. RAID 常见故障类型
RAID 阵列可能遇到以下常见问题:
- RAID 阵列降级(Degraded):一个或多个磁盘失效。
- RAID 阵列不可用(Inactive):RAID 配置损坏或未正确组装。
- RAID 阵列崩溃:多个磁盘失效,数据不可恢复。
2. 检查 RAID 状态
2.1 使用 cat /proc/mdstat
cat /proc/mdstat
输出示例(降级阵列):
md0 : active raid1 sdb[1]
1048576 blocks [2/1] [U_]
2.2 查看详细信息
sudo mdadm --detail /dev/md0
输出示例:
/dev/md0:
State : clean, degraded
3. 修复降级的 RAID 阵列
3.1 标记故障磁盘
如果 RAID 阵列中有故障磁盘,首先标记该磁盘为故障:
sudo mdadm --fail /dev/md0 /dev/sdc
3.2 移除故障磁盘
sudo mdadm --remove /dev/md0 /dev/sdc
3.3 替换磁盘并添加到阵列
将新的磁盘添加到阵列中:
sudo mdadm --add /dev/md0 /dev/sdc
3.4 自动重建
RAID 阵列会自动开始重建,使用以下命令查看进度:
cat /proc/mdstat
4. 重建 RAID 阵列
4.1 阵列未启动(Inactive)
如果 RAID 阵列状态为 inactive
,可以尝试重新组装:
sudo mdadm --assemble --scan
4.2 手动指定磁盘
若自动组装失败,可以手动指定参与的磁盘:
sudo mdadm --assemble /dev/md0 /dev/sdb /dev/sdc
4.3 重建缺失配置
如果 /etc/mdadm/mdadm.conf
配置丢失,可重新生成:
sudo mdadm --detail --scan >> /etc/mdadm/mdadm.conf
5. 数据恢复
5.1 使用 RAID 工具恢复数据
- 确认 RAID 阵列的级别和布局,执行以下命令:
sudo mdadm --examine /dev/sdX
- 根据输出信息,手动组装阵列恢复数据。