PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Server gecrashed



ViperRT-10
20.12.04, 08:51
Hallo Leute,

bei uns ist die K*cke am Dampfen.

Unserer Hauptbackupserver ist am Wochenende gecrashed, zweimal hintereinander. :eek: Ich habe gerade alle /var/log/messages durchgewurschtelt, aber nichts auffaelliges gefunden. Wo koennte ich noch nachschauen?

Die Maschine ist einfach stehen geblieben, keine Fehlermeldungen, weder auf der Konsole noch in den Logs, gar nichts, einfach weg.

Die Hardware:
DELL PowerEdge 1650 Single CPU
mit 2x PERC RAID (Typ kann ich jetzt nicht sagen).
Einmal on-board und das andere als PCI-X.

Software:
RHEL ES3 Update 2.

Ich habe schon danach gegoogelt, aber irgendwie finde ich nichts.

Danke Euch im Voraus, das ist verdammt wichtig.

Viper'

HEMIcuda
20.12.04, 09:10
Einfach stehengeblieben? Ich tippe auf einen Hardwaredefekt.
Schon einen Speichertest gefahren? Welcher Server ist es denn?
Doch nicht etwa der Samba-Server? <eg>

Gruss,

'cuda

ViperRT-10
20.12.04, 09:32
Japp, einfach stehengeblieben, keine Fehlermeldungen, nichts.

Das ist der VIORA2 (der mit 1TB SCSI drunter).

DELL OpenManage zeigt beim Speicher alles okay, aber ich teste mal den RAM mit dem Testmem.

Viper'

Stormbringer
20.12.04, 10:52
Hi,

wir hatten in der Vergangenheit häufiger mal Probleme mit dem verfluchten Dell PERC System (besonders prickelnd ist ja wohl, daß alle ~35 Tage der Akku per Software-Tool geladen werden soll/muß - wurde schnell durch ICP Controller ersetzt) ... Ist der bei euch ggf. leer, und nun sind die Platten/Partitionsinfos weg?

Gruß

ViperRT-10
20.12.04, 11:12
Hi,

also DELL OpenManage sagt dass alles okay ist. Die Firmware vom RAID ist etwas aelter als die von OpenManage vorausgesetzt, aber ich kann den Server schlecht einfach so runterfahren. Mal schauen, was sich machen laesst.

Zum Controller:

Naja, bei uns ist es etwas komisch. Mit dem Controller bin ich auch nicht zufrieden, aber wenn ich zum Chef latsche und sage, dass ich einen anderen brauche, verhaut er mich. Es wird nur das gekauft, was absolut notwendig ist. Wir "sparen" am Speicher fuer ExchangeServer und etc. Da brauche ich nicht mal mit sowas anzukommen.

Ich glaube die Maschine hat sich wieder gefangen, wir haben sie gerade richtig gestresst und den "rsize" und "wsize" fest eingestellt. Sieht gut aus. Mal schauen, wann er das naechste mal crashed.

Viper'

bla!zilla
20.12.04, 14:34
Wenn dir der Controller suspekt ist, dann muß dein Chef halt einen neuen Kaufen. Punkt. Du musst es deinem Chef nur verkaufen.