PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Server kann nicht mehr gestartet werden! (ev. MBR korrupt)



Belenus
07.09.06, 08:07
Hallo zusammen

Zuerst einige Infos zu meiner Serverumgebung:
OS: SuSE 9.2
Raid 5 System mit 4 IDE Festplatten (Partitionierung, siehe unten)
Server diente als Datenserver mit Samba und als Webserver (E-Learning System)
BackupSystem, wobei die Daten auf eine externe USB-Festplatte gesichert wurden.

Nun zum Problem:
Vor zwei Tagen lief der Datenserver nur noch langsam und User meldeten Datenverluste beim verschieben von Dateien. Auch auf dem Server konnte ich nicht problemlos arbeiten (sehr langsam) und desshalb entschied ich mich, den Server zuerst einmal neu zu starten. Gesagt - getan, doch leider konnte er nach dem POST den Bootloader (Grub) nicht mehr starten. Auf dem Monitor erschien nur der Name des Loaders "Grub" und dann blieb er hängen.
Nachdem ich versucht habe das OS mithilfe einer Rettungsdiskette zu starten, musste ich feststellen, dass gar keine Festplatte mehr erkannt wurde. Auch bei eines SuSE neuinstallation erkennt er keine Festplatten.
Wenn ich aber von einer Life-CD starte, erkennt und mountet er alle Partitionen. Nur können diese dank dem Raid 5 natürlich nicht einfach gelesen werden.
Gestern habe ich dann versucht den MBR neu zu schreiben und zwar mit dem Programm install-mbr von der Knoppix CD. Die hat lediglich eine andere Bildschirmausgabe verursacht denn anstatt "Grub" erscheint nun "MBR FA:"

Das Problem am Raid 5 System ist nun, dass ich die Festplatten nicht einfach kopieren und so die Daten sichern kann. Die externe USB Festplatte, welche eigentlich zur Datensicherung gebraucht worden wäre, wurde vor 2 Monaten ausgesteckt! Es existierte kein Script welches desshalb eine Warnmeldung produzierte. (Nein, die Umgebung wurde nicht von mir eingerichtet ;) )

Gerät Grösse Mountp.
/dev/sda 223GB
/dev/sda1 40GB /
/dev/sda2 80GB /backup
/dev/sda3 100GB
/dev/sda4 3.4GB swap
/dev/sda5 40GB /home
/dev/sda6 60GB /lwst

Hat jemand eine Ahnung was ich noch versuchen könnte? Ich wäre für Hilfe sehr dankbar..

marce
07.09.06, 08:21
HW oder SW-Raid?

Belenus
07.09.06, 08:22
Hardware Raid

baumgartner
07.09.06, 08:32
Aber du kannst deine Partitionen vom Raid5 unter Knoppix schon mounten oder?

Wenn ja, mach mal ein chroot hinein und für mal grub-install aus. /dev solltest du da auch mitreinbinden ;)

Achja, ich weiß wie sch*** das ist wenn man ein System warten soll das nicht von einem selbst kommt!

Belenus
07.09.06, 08:51
Aber du kannst deine Partitionen vom Raid5 unter Knoppix schon mounten oder?

Wenn ja, mach mal ein chroot hinein und für mal grub-install aus. /dev solltest du da auch mitreinbinden ;)

Achja, ich weiß wie sch*** das ist wenn man ein System warten soll das nicht von einem selbst kommt!

Jap, mounten sollte ich die Partitionen da können.
Vielen dank für die Antwort...werd das gleich mal versuchen.

Belenus
07.09.06, 09:29
Hm, nun kann ich die partitionen doch nicht mounten..
sie werden mir zwar alle angezeigt, doch wenn ich sie mounte will bringt er folgenden fehler: Falscher Dateisystemtyp, ungültige Optionen, der >Superblock< von /dev/hdb ist beschädigt, oder es sind zu viele Dateisysteme eingehängt.

marce
07.09.06, 09:37
nur noch mal zum Verständniss: Der Raid-Controller wird also erkannt und spielt auch?

"Nur" die Partitionen sind "defekt"?

baumgartner
07.09.06, 09:47
nur noch mal zum Verständniss: Der Raid-Controller wird also erkannt und spielt auch?

"Nur" die Partitionen sind "defekt"?

Joa, um welchen Raidcontroller handelt es sich dabei? Was sagt "lspci" dazu und was gibt "lsmod" aus?

Belenus
07.09.06, 09:48
Ich komm zumindest in die Raid-Konfiguration..
Die Partitionen werden mir im Knoppix auch angezeigt, können aber nicht gemountet werden..
Wenn ich aber ne SuSE CD einlege und Installieren anwähle, bekomme ich da wieder die Meldung, das keine Festplatten gefunden wurde...

marce
07.09.06, 09:49
... was wohl daran liegen dürfte, dass der Controller nicht erkannt wird oder kein Treiber dafür im Kernel ist.

... kriegen wir auch die Antworten auf die anderen Fragen?

So ein HW-Controller hat doch meist ein tolles BIOS - was sagt ein dort sicherlich vorhandenes Test-Tool denn zu dem Array bzw. den einzelnen Platten?

Belenus
07.09.06, 10:00
... was wohl daran liegen dürfte, dass der Controller nicht erkannt wird oder kein Treiber dafür im Kernel ist.

... kriegen wir auch die Antworten auf die anderen Fragen?

So ein HW-Controller hat doch meist ein tolles BIOS - was sagt ein dort sicherlich vorhandenes Test-Tool denn zu dem Array bzw. den einzelnen Platten?

Ja, Antworten kommen gleich..
Im BIOS des Controllers werden die Platten richtig erkannt und können auch zugeteilt werden...von da her dachte ich der Controller sei noch i.O.
Wegen dem Testtool schau ich gleich nochmals..

Belenus
07.09.06, 10:04
Joa, um welchen Raidcontroller handelt es sich dabei? Was sagt "lspci" dazu und was gibt "lsmod" aus?

Also, bei lspci bekomm ich folgende Antwort:
01:02.0 RAID bus controller: American Megatrends Inc. MegaRAID (rev 02)

Mit lsmod folgendes:
megaraid 24909 0

baumgartner
07.09.06, 10:25
Was sagt denn ein fdisk -l /dev/hdb?

Wobei sich Bad Superblock allgemein nicht so gut anhört :-/


EDIT: dmesg|grep raid

Belenus
07.09.06, 10:44
Was sagt denn ein fdisk -l /dev/hdb?

Wobei sich Bad Superblock allgemein nicht so gut anhört :-/


EDIT: dmesg|grep raid

Ups...beim fdisk -l /dev/hdb geschieht gar nix...:

root@ttyp0[root]# fdisk -l /dev/hdb
root@ttyp0[root]#

Mit dmesg|grep raid findet er aber immerhin die vier Laufwerke in Channel 1, 2, 3 und 4...

baumgartner
07.09.06, 10:58
Kannst du die Ausgabe auch posten?

Willst du das Raid wiederherstellen oder möchtest du neu aufsetzen? Gibt es im Raid-Bios die möglichkeit das Raid zu zerstören/neues Raid anlegen?

Belenus
07.09.06, 11:05
ja im Raid BIOS gibt es die Möglichkeit...es wurde aber bereits versucht das Raid neu zu konfigurieren.

Da auf den Festplatten einige wichtige Daten sind, wäre es schön wenn ich den Server so wieder zum laufen bringe.. Falls das aber nicht möglich ist, werde ich ihn neu aufsetzen..

Werde die Ausgabe gleich posten..

marce
07.09.06, 11:09
hm, da kein Backup natürlich kritisch - aber ein geforctes fsck könnte reichen...

Alternativ zum Backup vorher die einzelplatten dd-en...

Wenn der Controller und die Platten ok sind und wirklich "nur" der Superblock tot - lässt sich mit div. Tools evtl. was machen (glaube mich an ein paar Threads hier hierzu erinnern zu können - bemühe mal die Suchfunktion...)

Belenus
07.09.06, 11:11
root@ttyp0[root]# dmesg|grep raid
megaraid: v1.18 (Release Date: Thu Oct 11 15:02:53 EDT 2
megaraid: found 0x101e:0x1960:idx 0:bus 1:slot 2:func 0
megaraid: [6.62:1.03] detected 4 logical drives
megaraid: supports extended CDBs.
megaraid: channel[1] is raid.
megaraid: channel[2] is raid.
megaraid: channel[3] is raid.
megaraid: channel[4] is raid.

baumgartner
07.09.06, 11:21
Wollt ich auch grad vorschlagen. Ich würde nur vor dem fsck noch mit dd (oder dd_rescue (http://www.linux-user.de/ausgabe/2004/08/048-dd-rescue/)) Backups ziehen ;)
Tipp: Du musst die Platten natürlich rausnehmen und auf einen anderen Controller hängen, und nummeriere sie, so dass du sie nachher auch wieder in der richtigen Reihenfolge einbauen kannst!

Tja, ansonsten Raid zerstören und neu aufsetzen. Sollte Suse das Raid nicht erkennen, dann beim neuaufsetzen auf ein Terminal wechseln und den Treiber händisch nachladen.

Belenus
07.09.06, 11:25
hm ja, dann werd ich mal versuchen mit dd ein Backup zu machen. Vielleicht habe ich ja nochmals Glück ;)
Vielen Dank für die Hilfe!