Anzeige:
Ergebnis 1 bis 4 von 4

Thema: Hohe Last und viele Fehler mit Etch & Software-RAID 1

  1. #1
    Registrierter Benutzer
    Registriert seit
    Jul 2006
    Beiträge
    18

    Hohe Last und viele Fehler mit Etch & Software-RAID 1

    Hallo!

    Ich versuche gerade, einen Server mit Debian Etch und RAID 1 aufzusetzen.
    Das Software-RAID hatte ich direkt bei der Installation angelegt, weiss auch das ich das richtig gemacht hab (mehrmals erfolgreich mit Sarge schon durchgeführt). Meine Festplatten sind 2x250GB Hitachi VLAT80 (IDE), ansonsten stecken noch ein Pentium4 3,2GHz und 512MB RAM drin.

    Mein Problem:

    Durchgang 1: nach der Grundinstallation (Partitionen als ext3) hab ich mir /proc/mdstat anzeigen lassen. Seltsamerweise waren bei 2 MD-Geräten direkt eine Festplatte als fehlend / fehlerhaft angezeigt: [_U]. Ich habe daher mit mdadm -add /dev/hdb3 /dev/md3 (oder so ähnlich) die Synchronisation angestossen. Dabei schwankte der Durchsatz sehr stark und die Load Average ging über 5. Als Restzeit wurden mir 990Minuten angezeigt. Ich hab daher mal über Nacht stehen lassen, am nächsten Morgen hatte ich nur eine Kernel Panic, aber davor nur irgendwelche Statusmeldungen. Nach Reboot waren beide fehlenden Partitionen immer noch unverändert.

    Durchgang 2: Nach einer kompletten Säuberung mit DBAN hab ich die Installation nochmal durchgeführt. Nur die root-Partition war synchron, alle anderen haben automatisch mit Synchronisation angefangen und der Server war extrem ausgelastet.

    Jetzt habe ich über Nacht mal ein Festplatten-Check-Tool durchlaufen lassen, das keine Fehler gefunden hat.

    Im Moment führe ich gerade Durchgang 3 mit kleinen Testpartitionen und verschiedenen Dateisystemen durch.


    Woran kann das liegen? Warum funktioniert das Software-RAID nicht so wie ich es von Sarge gewohnt bin?
    Ich bin mir ziemlich sicher, dass die Festplatte funktioniert, da ich bis vor kurzem noch Sarge fehlerfrei drauf hatte.

    Irgendwelche Ansätze?


    Danke im Voraus,

    Duddle

  2. #2
    Registrierter Benutzer
    Registriert seit
    Nov 2001
    Beiträge
    680
    Hast du den aktuellen Standard-Kernel von etch genommen? Ich denke mich zu erinnern, dass irgend eine Version in testing mal arge Probleme machte mit RAID.

  3. #3
    Registrierter Benutzer
    Registriert seit
    Aug 2004
    Ort
    Bad Wünnenberg
    Beiträge
    5.402
    Ich habe auf mehreren Etch-Servern RAID1 im Einsatz und keinerlei Probleme.

    Die hohe Load könnte sich vielleicht damit erklären lassen, dass eine oder mehrere Platten keinen DMA-Modus aktiviert hatten.

    Auch wäre es interessant zu erfahren, wie genau du das RAID angelegt hast.
    Gruß,
    Tomek

  4. #4
    Registrierter Benutzer
    Registriert seit
    Jul 2006
    Beiträge
    18
    Hmmm, ich dachte ich hatte hier schon einen Edit gemacht... jedenfalls gehe ich mittlerweile von einem Hardwaredefekt aus. Ich hatte sehr viele Fehler ala "BadCRC" gehabt und auch ein paar Meldungen über DMA. Hab dann testweise auch mal versucht SuSE draufzuspielen und das hat dann auch tausende Fehlermeldungen ausgegeben. Nach einem 30stündigen Test mit badblocks auf Knoppix denke ich, die Festplatten an sich sind OK, daher irgendein Teil zur Ansteuerung dieser defekt ist.

    Ich habe jedenfalls den Kernel, der bei der Netinstall dabei ist. Also gehe ich stark davon aus, dass der aus stable stammt.
    Und ja, die Platten haben laut Knoppix und hdparm -d kein DMA aktiviert gehabt. Ich bin aber kein großer Hardwarekenner, darum weiss ich nur, dass das schlecht ist - nicht aber wie ich es dauerhaft beheben könnte.

    Das RAID habe ich im Installer angelegt: auf beiden Platten die selben Partitionen mit RAID-"Dateisystem" angelegt, dann im Menüpunkt "Software RAID konfigurieren" (o.ä.) ein RAID1 angelegt. Ab exakt diesem Zeitpunkt (sobald er sozusagen beide Partitionen miteinander verbindet) reagiert der Rechner nur noch träge.

    Jedenfalls versuche ich gerade als Alternative, den eingebauten Hardware-RAID-Controller zu nutzen. Der ist aber von Fasttrak (Promise 376/378) und dafür ist die Treiberunterstützung nicht gerade rosig...

    Danke jedenfalls für die Hilfe.


    Duddle

Ähnliche Themen

  1. Linux Software Raid - Verständnisfrage
    Von baetmaen im Forum Linux als Server
    Antworten: 4
    Letzter Beitrag: 17.11.06, 15:36
  2. WLAN RTL8180 unter Kubuntu
    Von srvguy im Forum Anbindung an die Aussenwelt
    Antworten: 103
    Letzter Beitrag: 19.02.06, 19:51
  3. software RAID 5 system unter linux
    Von Carcass im Forum stationäre Hardware
    Antworten: 21
    Letzter Beitrag: 27.10.04, 14:59
  4. Wo führt das hin ...
    Von kdre im Forum Linux Allgemein
    Antworten: 45
    Letzter Beitrag: 14.07.03, 13:36
  5. RPM Fehler und Befehle fehlen
    Von Windi im Forum Linux Allgemein
    Antworten: 4
    Letzter Beitrag: 04.05.03, 17:09

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •