PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Suse Advanced Server bleibt einfach stehen



Joke17
30.11.04, 09:19
Guten Tag,

ich hab da ein kleines Problem bei einem Kunden.

Suse Advanced Server mit Raid und DHCP. Der Server fungiert einzige und allein als FS und DHCP, allerdings relativ groß.
Redundant dazu gibt es noch einen zweiten Server, der allerdings nur eingeschaltet wird, falls der erste abraucht und somit bisher nie an war.

Nach Fehlern auf dem einen hatten die den zweiten einfach dazu geschaltet, somit 2 DHCP Server die sich alle paar Minuten gegenseitig gekickt haben.
Die Probleme mit dem ersten Server traten nach einem Klimaanlagenausfall auf, bei dem der Serverraum ca. 50° hatte.

Der Suse Server läuft und wenn sich immer mehr Leute anmelden, bleibt der einfach irgendwann stehen. Das Bild friert ein und man kann nichts machen außer den Powerknopf zu drücken. Bleiben wenig Benutzer angemeldet, rennt das Ding ohne weiteres.

Mit der Hardware kann nichts sein, da ja Raid(welches sich abschalten müsste sobald ein Festplattenfehler auftritt) funktioniert und vom Netzwerk her noch mehr Server da sind, die alle auf einen Gigabit Switch auflaufen und die alle funktionieren.

In die Logdateien wird nichts eingetragen soweit der Admin berichtete, aber er will man schaun, ob das ab einer bestimmten Anzahl an Benutzern auftritt, oder vielleicht sogar direkt bei nur einem Benutzer.

Könnte es auch sein, dass die sich gegenseitig die Daten weggenommen haben, als beide liefen und somit fehlerhafte Einträge vorhanden sind?

Vielleich hat ja schonmal einer ne Idee und kann mir weiter helfen.

Besten Dank und MfG
tImo

heatwalker
30.11.04, 09:39
Das ist jetzt wie ein schauen in die Kristallkugel. (-:

Bist du sicher das es nicht an der Hardware liegt??? Bei 50 Grad Raumtemperatur hast
du im Gehäuse so um die 70-80 Grad. Der Prozessor dürfte um einiges heisser geworden
sein.

Ich tippe einfach mal auf Defekte durch Hitze.

Alternativ kannst du die Platten ja mal auch Fehler überprüfen lassen.

netzmeister
30.11.04, 09:39
Hallo,

für mich hört sich das ziemlich nach einem Hardwaredefekt an.
Bei einer derart hohen thermischen Belastung wurde wahrscheinlich
das System geschädigt.

Viele Spaß bei suchen, ... :D

Mit dem DHCP hat das kaum etwas zu tun.

Viele Grüße

Eicke

Joke17
30.11.04, 09:48
Hach... ich hab vergessen was ein zu baun...

Der zweite Server lief noch nicht bei 50° sondern hinterher, als die Raumtemperatur wieder normal war. Die Daten wurden 1:1 übernommen und bei beiden Server tritt der gleiche Fehler auf.

Wie gesagt, an den Festplatten kann es auf keinen Fall liegen, weil der Raidcontroller bei einem Plattenfehler einfach das Device abschaltet und einen Höllenton von sich gibt ;)

Das ist auch kein Geschenk mit dem suchen. Vor allem, wenn man nicht direkten Zugriff auf das Teil hat, sondern immer nur mit dem Admin sprechen muss.

Trotzdem auf jeden schonmal besten Dank für die schnellen Antworten.

P.S.
das sind schon zwei richtig große Siemensserver, die abgeschaltet hätten falls es ihnen zu heiß geworden wäre.

bla!zilla
30.11.04, 09:56
Ich denke nicht das die Server sich abgeschaltet hätten. Ich weiss nicht was das für Kisten sind, aber bisher kenne ich thermische Abschaltungen nur aus der Host bzw. Midframe Welt.

Ich tippe auch auf einen Hardwaredefekt.