PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Aufhängen des Systems (Linux, Truecrypt, NFS, VirtualBox, Opensolaris)...



Matze88m
09.02.10, 11:32
Hallo zusammen,

Ich habe ein Problem, welches in in etwas größerem Umfang beschreiben muss:

Ich fange dabei mit den Anforderungen an mein System an:
NAS mit ZFS, TV schauen, Musik hören.

Meine "Problemanalyse" hat dabei zu linux mit zfs-fuse geführt. Dabei trat das Problem auf, dass das Kopieren von Daten einer Truecrypt-Partition (alte Festplatte mit Partition als Truecrypt-Basis) in einen Truecrypt-Dateicontainer irgendwann zum Aufhängen des Systems (manchmal auch nur zum Aufhängen von Truecrypt und ZFS) geführt hat.

Ich bin dann davon ausgegangen, dass dies ein Problem der ZFS-Fuse Implementierung ist und habe nach Alternativen gesucht. Als einzige weitere Möglichkeit kommt nur VirtualBox mit Opensolaris in Frage:
Linux als Host, dadrin eine VM mit Opensolaris fürs ZFS. Partitionen der Hostfestplatten können über VirtualBox an den Gast weitergereicht werden, der macht dort einen ZFS Pool mit entsprechenden ZFS Partitionen und gibt diese über NFS frei.

Nun muss ich Daten drauf spielen (mal wieder u.A. auch auf Truecrypt-Container):
ca. 1 TB unverschlüsselt ohne Probleme (mit Datenraten im Bereich von 20 MB/s - nicht super, aber ausreichend).
Nun kommt ein Truecrypt-LW dran:
Truecrypt-Datei-Container mit 300 GB anlegen klappt ohne Probleme.
Am Ende dann will er das Root-Passwort, um das Dateisystem (ext2) zu erzeugen, daraufhin hängt sich das System auf (nachdem es 10-30 Sekunden noch kurz auf der Festplatte arbeitet)
3 weitere Versuche, manuell das Dateisystem zu erzeugen:
1. -> aufgehangen, allerdings erscheint nach Druck auf den Powerbutton noch die "System is shutting down..." Nachricht, es passiert jedoch nichts.
2. -> Aufgehangen (ca. 100 von den wenigen 1000 Inodes schafft er zu schreiben), im Kernel log sehe ich page allocation failure Nachrichten[1]
3. -> Aufgehangen, auf einem SSH Terminal kann ich sogar den tail -f syslog noch abbrechen, jedoch hängt auch dieses sich auf, sobald ich weiterhin irgendwas mache.


Dies deutet für mich nun nach allem auf einen Fehler in Zusammenhang mit Truecrypt hin, vielleicht habe ich gar zfs-fuse zu unrecht verurteilt.
Wer kann mir bei der Fehlersuche helfen?

Truecrypt ist 6.3a, selbst kompiliert (gibt leider kein Debianpaket). Ich konnte mit der Version allerdings vor einigen Tagen mit der zfs-fuse Variante 30-50 GB kopieren (1 cp Befehl), bevor dieses (oder der ganze Rechner) sich aufgehangen hat.

Das System:
Asus M2A-VM (AMD 690g mit SB600 Onboard SATA Controller)
Athlon 64 X2 3800+
2x Samsung F2 eco green 1,5 tb (neu)
je 1x Samsung F1 750GB, Seagate 7200.10 500 GB (alt)
1 GB Ram (hier liegt u.A. ein Knackpunkt)

Das System ist komplett prime-stabil über mehrere Tage. Ich hatte noch nie ein Problem mit Abstürzen oder ähnliches.

Um nun bei dem Page allocation failure einen ernsthaften RAM-Mangel auszuschließen habe ich die VM-Speicherallokation um 300 MB gesenkt und alle unnötigen Prozesse gestoppt.
Vor dem Starten der Formatierung sind dann 10 MB Ram frei, jedoch etwa 500 MB "cached", d.h. der Ram ist eigentlich halb leer. Wie gesagt, alle anderen Datenkopiervorgänge liefen mit wesentlich weniger Speicher: VM hatte 600 MB (nun 300), außerdem liefen noch MySQL und MythTV-Backend.

Syslog Nachrichten: (Dies konnte ich von 3 Versuchen nur einmal erzeugen, die anderen Aufhänger hinterließen keine Logeinträge.
[1] Anhang: syslog.txt


Linux-Version:
Linux version 2.6.32-trunk-amd64 (Debian 2.6.32-5) (ben@decadent.org.uk) (gcc version 4.3.4 (Debian 4.3.4-6) ) #1 SMP Sun Jan 10 22:40:40 UTC 2010