Anzeige:
Ergebnis 1 bis 6 von 6

Thema: Hardware Raid 5 Rebuild fehlgeschlagen - weitere Strategie?

  1. #1
    Registrierter Benutzer
    Registriert seit
    Jan 2013
    Beiträge
    7

    Hardware Raid 5 Rebuild fehlgeschlagen - weitere Strategie?

    Hallo zusammen,

    ich habe hier einen Linux-Homeserver zur Bereitstellung eines Netzlaufwerks für die Daten der Familie per Samba.

    Distribution: openSuSe 13.2
    Raidcontroller: High Point Rocket Raid SAS/SATA 2720A
    Festplatten: 6x Seagate 3 TB in RAID-5-Verbund + 1x Hotspare
    Das Betriebssystem liegt auf einer separaten 120 GB SSD.

    Der Server lief seit 2016 vollkommen ohne Probleme, dann vor kurzem plötzlich sehr langsame Lesegeschwindigkeit und es ließen sich keine Dateien ins Samba-Laufwerk schreiben. Näher nachgeschaut und festgestellt, dass das Raid-Laufwerk plötzlich nur noch lesend eingebunden war. Server neu gestartet und das Laufwerk wurde automatisch wie immer mit Schreibrechten eingebunden. Datenzugriff trotzdem immer noch sehr langsam. (1 MB/s statt wie früher bis zu 100 MB/s). Die SMART Daten der Festplatten am Raidcontroller ergaben eine Auffälligkeit bei einer der Festplatten wurden aber vom Raidcontroller immer noch wie bei den anderen Platten als "OK" bezeichnet.
    Das Raid-Volume an sich wurde als in Ordnung angezeigt. Daraufhin habe habe ich erstmal den Samba-Dienst beendet um weitere Zugriffe und Änderungen zu verhindern und am Raidcontroller ein "Verify" gestartet, der ungefähr nach 3 h fertig war und einen automatischen Rebuild startete.
    Nach etwa 8 Tagen ist dieser bei ca. 40% abgebrochen mit der Fehlermeldung:

    Code:
    "An error occured on the disk at 'ST3000VX000-1ES166-W500WQM8' at Controll=
    er1-Channel2."
    Es handelt sich dabei um die Disk mit den auffälligen SMART Daten. Das Raid wird jetzt als "Critical" angezeigt. Auf die Daten lässt sich jedoch trotzdem noch zugreifen allerdings wie vorher nur mit "angezogener Handbremse"
    Die SMART Übersicht sieht nun so aus:

    2.png

    Ich habe ein Backup aller Daten, das jedoch leider etwa 4 Monate alt ist und sich derzeit verteilt auf zwei 8 TB Platten befindet.

    Könnt ihr mir einen Tipp geben wie ich nun am besten weiter vorgehe?

    Meine Idee war nun mir weitere Festplatten zu kaufen und jede einzelne Platte des Raids erstmal mit dd_rescue zu sichern bevor ich weitere Versuche unternehme.

    Grüße
    Jan

  2. #2
    Registrierter Benutzer Avatar von just4uk
    Registriert seit
    Mar 2002
    Ort
    im Wilden Süden L.E.
    Beiträge
    581
    als aller erstes BACKUP!
    als 2tes was ist den mit der Hotspare?
    wenn eine Disk aus dem Verbund herausfällt muss die Hotspare einspringen, dafür ist sie eigentlich vorgesehen!

    Gruß aus L.E.
    Uwe
    Bei U/Linux hilfreich aber nicht nötig, bei Windows nötig aber nicht hilfreich!
    Rechtschreibfehler sind beabsichtigt und Ausdruck meiner Persönlichkeit

  3. #3
    Registrierter Benutzer
    Registriert seit
    Dec 2003
    Ort
    Dettenhausen
    Beiträge
    22.054
    Ob die Hotspare automatisch einspringt ist meist ein Controller-Setting.

    Platten per dd klonen - hilft evtl. nicht viel - je nach Controller nimmt der auch gerne mal die Hardware-IDs zu Hilfe und die bekommst Du damit nicht auf die neuen Platten übertragen.

    Erst mal würde ich ein sauberen Backup machen. Raid ist kein Backup - und kein Backup braucht man nur, wenn die Daten nicht wichtig sind.

    Dann würde ich schauen, warum die Hotspare nicht rein gegangen ist und mit der ggf. per manuellem Anstupsen das Raid reparieren - parallel schon mal neue HDs besorgen - 5 Jahre sind für HDs ein guter Punkt, wo man sie gerne mal austauschen darf. Vor allem kann es sein, wenn die erste Platte das zicken anfängt, daß die anderen zeitnah folgen.
    Ich bin root - ich darf das.

  4. #4
    Registrierter Benutzer
    Registriert seit
    Jan 2013
    Beiträge
    7
    Danke schonmal für die Rückmeldungen!

    Das seltsame ist: Nach Bemerken des plötzlich langsamen Raids, wurde dieses vom Controller noch als volkommen in Ordnung angezeigt. Die automatische Verwendung des HotSpares und Rebuild ist eingestellt. Aber: Erst nach einem manuell ausgelöstem "Verify" erkannte der Controller, dass das Raid nicht mehr in Ordnung ist und begann den Rebuild.

  5. #5
    Registrierter Benutzer
    Registriert seit
    Jan 2013
    Beiträge
    7
    Sehe ich das richtig, dass die langsame Geschwindigkeit durch die Berechnung der Paritätsdaten beim lesen der Daten entsteht? Oder hat das andere Hintergründe.
    Hätte ich mit einem RAID 10 beim Ausfall einer Platte außerhalb des Rebuild-Prozesses noch volle Geschwindigkeit?

  6. #6
    Registrierter Benutzer
    Registriert seit
    Dec 2003
    Ort
    Dettenhausen
    Beiträge
    22.054
    Wann und wie ein Controller eine HD als defekt erkennt ist oftmals eher als mystisch zu bezeichnen - da spiegelt sich auch immer ein wenig das Preislevel und der Anspruch des Controllers wieder, plus die Art der verwendeten Festplatten und deren Zusammenspiel mit dem Controller.

    Was die Geschwindigkeit angeht: Das lesen der Daten hat (hoffentlich) weniger damit zu tun, eher daß ein Raid5 was den IO-Overhead betrifft eine der ineffizientesten Methoden (sprich langsamten) ist. Ob ein Raid 10 da schneller wäre - rein rechnerisch ja (da er ja nur eine HD direkt auf eine andere spiegeln müsste) - ob das aber der Fall ist hängt wieder sehr von der internen Controller-Logik ab. Und dann kann die interne Verkabelung auch noch reinspielen und einen ausbremsen.
    Ich bin root - ich darf das.

Ähnliche Themen

  1. Software-Raid 5 rebuild aus 2 Spare Devices
    Von Zondan im Forum Linux als Server
    Antworten: 12
    Letzter Beitrag: 14.02.11, 22:08
  2. Raid 1 - Software-Raid oder Hardware-Raid?
    Von Mister-X im Forum stationäre Hardware
    Antworten: 5
    Letzter Beitrag: 08.05.10, 23:47
  3. Software-RAID, Hardware-RAID, beste Konfiguration ?
    Von swen1 im Forum System installieren und konfigurieren
    Antworten: 2
    Letzter Beitrag: 10.08.04, 11:36
  4. Weitere HD's einbauen in SCSI-Raid (RedHat9) - Wie?
    Von socrates im Forum System installieren und konfigurieren
    Antworten: 4
    Letzter Beitrag: 13.07.04, 12:14
  5. rpm --rebuild => --rebuild: unknown option => *HELP* <=
    Von DrainDZ im Forum Kompilieren von Kernel und Sourcen
    Antworten: 0
    Letzter Beitrag: 09.04.03, 20:25

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •