PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Linux-Hosts iSCSI LUNs --> sicherer Start



pede
07.12.07, 14:32
Hallo Leute,
ich grüble hier über eine Startproblem einfacher oder besonderer art.
Ausgangs-Situtation:
4 Linux-Hosts (openSUSE 10.2) sind an ein iSCSI System über QLA4xxx HBAs angeschlossen.
Auf dem iSCSI-System wurden ca 20 LUNs angelegt und von den Hosts aus mit ext3 Partitionen versorgt (1-LUN = 1-ext3-Partition)
Das iSCSI-System ist so konfiguriert, das alle Hosts alle LUNs sehen.
Die Partition die auf den einzelnen Hosts gemountet werden sollen sind per Pfad-ID in der fstab eingetragen.
bsp aus fstab: (/dev/disk/by-path/pci-0000-.....:99-part1 /san/test ext3 acl,user_xattr 1 2)
In den ext3 Partitionen sind VMWare Maschinen abgelegt.
In den Partitions-Tabelle der Linux-Hosts werden alle verfügbaren LUNs=iSCSI-Partitionen angezeigt.
Durch z.B. umount /dev/sdg1 eines device auf Host-A und mount der gleichen device auf Host-B will ich einen leichten Hardware-Umzug einer VM-Maschine realisieren.

System läuft so.

Problem:
Beim gleichzeitigen starten aller Linux-Hosts erkennt der schnellste zuerst,
das z.B. eine Partition ( die er nicht einmal mounten soll) bereits 2 Monate nicht überprüft
wurde und nun per check-Programm zum Überprüfen ansteht,
und startet dann auch diese Überprüfung.
Die anderen Hosts kommen während Ihres Startvorgangs ebenfalls an dies Überprüfungs-Stelle
und dann ....

Auf diese Weise habe ich nun eine wichtige ext3-Partiton verloren (LUN ist noch da, aber
die darin befindliche Partition ist nicht wiederherstellbar weg)

Frage:
Wie kann ich sicher verhindern, das sich die Hosts beim Startvorgang in die Quere kommen ?
ohne den Vorteil eines leichten Hardware-Umzugs einer VM-Maschine aufzugeben ???

Auf eure Vorschläge hofft
mfg pede

cane
07.12.07, 16:03
Mal den VMWare ESX angeschaut - der ist für Business Szenarien wie Du sie beschreibst gedacht...

mfg
cane

pede
07.12.07, 16:24
Wir haben auf den Linux-Hosts VMWare-Server im Einsatz.
Meiner Kentniss nach sollte für "kleiner" Umgebungen, wie die unsere, diese Software ausreichend sein.

pede

cane
07.12.07, 16:36
Ansichtssache - der freie VMWare Server hat ein paar bugs die ab und an VMs im betrieb hart abschmieren lassen, hatte deswegen schon einige kaputte Berkley Datenbanken - ansonsten ist er ganz okay...

Zum aktuellen Problem würd ich mal in die VMWare Community schauen - da gibts sehr gute Topics zu solchen und ähnlichen Themen.

mfg
cane

Thallez
09.12.07, 23:23
Du solltest eine Cluster fähiges Dateisystem wählen wie das GFS von Red Hat
http://www.redhat.com/gfs/

bla!zilla
10.12.07, 08:25
Grundsätzlich ist im SAN eine Konfiguration wie du sie hast (jeder Host sieht alle LUNs) absolut unangebracht. Bitte nutze die LUN Masking Szenarien deines Storage-Systems. Alternativ kannst du, wie Thallez schon sagte, auf ein cluster-fähiges Dateisystem ausweichen, wobei das für diene Zwecke sicherlich am besten geeignet ist. Von der Performance her ist das wieder eine andere Sache. Schau dir dahingehend mal Oracle Cluster Filesystem 2 an.

pede
10.12.07, 09:05
Vielen Dank für eure Vorschläge,
ich werde mir die entsprechenden Technologien mal im Detail anschauen.
Jedoch:
Ich habe eine lauffähiges Produktivsystem und kann jetzt nicht einfach mal das Dateisystem ändern.
Was ich im laufenden Betrieb machen könnte, sind das ändern von Dateisystem - Parametern.
Die von bla!zilla vorgeschlagenen LUN-Masking Einstellungen sind sicher sicher, wenn ich jedoch einen anderen Weg finden könnte --> wäre schön.

Hab mir auch schon ein paar Maßnahmen überlegt:
1.) in allen fstab´s das mounten der SAN-devices mit dem CHECK-Parameter
von =2 auf = 0 umstellen
2.) bei den ext3-Dateisystem-Parametern über tune2fs -c die Anzahl der Mountvorgänge vor einer neuen autom. überprüfung auf 0 stellen und
das zeitlich gesteuerte Überprüfen nach einem bestimmten Zeitraum z.B. 2 Monatne abschalten.

Was haltet Ihr davon ?

mfg pede

bla!zilla
10.12.07, 10:18
Gar nichts. Du kannst in dieser Konfiguration nicht sicherstellen das du nicht irgendwann mal Dateisystemmüll hast. Ich rate dir dringend zu LUN Masking.

btw: Warum fällt dir in einem Produktivsystem auf einmal auf, dass es nicht optimal ist?!

pede
10.12.07, 12:25
Solange ich im Testsystem mit nur einem Host gearbeitet habe, ist das Problem natürlich nie aufgetreten.

mfg pede

bla!zilla
10.12.07, 12:38
Na dann ist das ja auch kein Testsystem. ;) Das hätte ja dann min. zwei Hosts haben müssen, wenn von Anfang an mit mehreren Hosts geplant worden ist.

pede
10.12.07, 15:33
wo du recht hast, hast du recht !

mfg pede