df8oe
25.05.05, 10:56
Hallo an alle,
ich habe auf meinem (Linux)-Server seit Jahren ein Soft-RAID1 - System laufen. Gestern nun hat sich das System mit einer Kernel-Panic "in die Ecke gehängt". Irgendwas Aussagekräftiges stand nicht im Log, also habe ich das System wieder gestartet und gesehen, was passiert.
Es läuft eine SuSE 8.1 darauf mit zwei IDE-Platten und insgesamt drei md - Devices.
Der Resync von /dev/md0 und /dev/md1 verlief schnell und fehlerfrei, bei /dev/md2 jedoch gab es ein Problem: bei 98,2% wurde auf einmal der Datendurchsatz beim Resyncen immer geringer, und irgendwann war er anstelle von 30.000kb/s bei 500kb/s. Dann war es das - System wieder in der Ecke :(
Ich vermutete also, daß es sich um einen Plattenfehler handelt und habe eine der beiden Platten aus dem betreffenden raid als "faulty" gesetzt und dann mit raidhotremove entfernt. Seitdem läuft das System einwandfrei und stabil.
Ein fsck auf der verbliebenen Platte im betreffenden md erbrachte keine Fehler; ich habe wohl durch Zufall das richtige Device entfernt.
Ich möchte natürlich gerne wissen, ob es wirklich das "richtige" device war, und will nun auf der entsprechenden Partition des entfernten devices (die ja nun nicht mehr in Betrieb ist) einen ausfühtlichen Schreib/Lesetest durchführen. Z.B. alle Sektoren mit 00 beschreiben und wieder lesen...
Dazu reichen meine Konsolenkenntnisse aber nicht aus. Mit welchem Befehl kann ich alle Sektoren der betreffenden Partition auf die beschrieben Weise testen? Auch, wenn es recht unwahrscheinlich ist, daß die zweite Platte auch noch ausfällt: so mag ich es nicht...
Fragend
df8oe
ich habe auf meinem (Linux)-Server seit Jahren ein Soft-RAID1 - System laufen. Gestern nun hat sich das System mit einer Kernel-Panic "in die Ecke gehängt". Irgendwas Aussagekräftiges stand nicht im Log, also habe ich das System wieder gestartet und gesehen, was passiert.
Es läuft eine SuSE 8.1 darauf mit zwei IDE-Platten und insgesamt drei md - Devices.
Der Resync von /dev/md0 und /dev/md1 verlief schnell und fehlerfrei, bei /dev/md2 jedoch gab es ein Problem: bei 98,2% wurde auf einmal der Datendurchsatz beim Resyncen immer geringer, und irgendwann war er anstelle von 30.000kb/s bei 500kb/s. Dann war es das - System wieder in der Ecke :(
Ich vermutete also, daß es sich um einen Plattenfehler handelt und habe eine der beiden Platten aus dem betreffenden raid als "faulty" gesetzt und dann mit raidhotremove entfernt. Seitdem läuft das System einwandfrei und stabil.
Ein fsck auf der verbliebenen Platte im betreffenden md erbrachte keine Fehler; ich habe wohl durch Zufall das richtige Device entfernt.
Ich möchte natürlich gerne wissen, ob es wirklich das "richtige" device war, und will nun auf der entsprechenden Partition des entfernten devices (die ja nun nicht mehr in Betrieb ist) einen ausfühtlichen Schreib/Lesetest durchführen. Z.B. alle Sektoren mit 00 beschreiben und wieder lesen...
Dazu reichen meine Konsolenkenntnisse aber nicht aus. Mit welchem Befehl kann ich alle Sektoren der betreffenden Partition auf die beschrieben Weise testen? Auch, wenn es recht unwahrscheinlich ist, daß die zweite Platte auch noch ausfällt: so mag ich es nicht...
Fragend
df8oe