PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Hangcheck Timer - sinnvoll oder nicht?



Shutdown
18.09.04, 12:21
Hi,

ich frage mich schon seit einiger Zeit, ob es sinnvoll ist oder nicht, seinen Kernel mit der Option "Hangcheck_Timer" zu kompilieren oder nicht.
Bringt es wirklich was bzw wird das System dadurch irgendwie stabiler oder kann man die Kontroller über das System manchmal noch zurückgewinnen oder ist es schlicht und einfach sinnlos?

Shutdown

Jasper
18.09.04, 12:32
ich frage mich schon seit einiger Zeit, ob es sinnvoll ist oder nicht, seinen Kernel mit der Option "Hangcheck_Timer" zu kompilieren oder nicht.
Bringt es wirklich was bzw wird das System dadurch irgendwie stabiler oder kann man die Kontroller über das System manchmal noch zurückgewinnen oder ist es schlicht und einfach sinnlos?


hangcheck_timer versucht den rechner neu zu starten wenn der kernel hängt. ob du diese funktion brauchst musst du selbst entscheiden.


-j

Shutdown
18.09.04, 12:39
Das weiss ich schon ;)
Ich wollte nur wissen, ob das überhaupt funktioniert...weil wenn der Kernel hängt, würde ja rein theoretisch auch das hangcheck timer Modul "mithängen", oder?

Shutdown

zander
18.09.04, 13:09
Das hängt ganz vom Zustand des Kernels ab, es gibt verschiedene Arten von "Hängen".

Shutdown
18.09.04, 13:59
Ach so, ich kenn mich da nicht sonderlich aus...ich werd das Feature dann ma reinmachen, wenn er sich selber neustarten kann ist's für mich ok ;)
DANKE!!!

Shutdown

Jasper
18.09.04, 18:42
Das weiss ich schon ;)


na, dann sag das doch :)



Ich wollte nur wissen, ob das überhaupt funktioniert...weil wenn der Kernel hängt, würde ja rein theoretisch auch das hangcheck timer Modul "mithängen", oder?


sicher, wenn der kernel komplett panicked bringt der hangcheck nix. dann lieber einen hardware-watchdog einsetzen.
der hangcheck prüft, ob der kerneltimer synchron zum prozessortimer läuft. wenn bspw. der kernel (kurzzeitig) hängt und deshalb der kerneltimer nicht aktualisiert werden kann, so stellt hangcheck diese differenz fest und startet ab einer gewissen abweichung den rechner neu. deshalb muss der kernel "prinzipiell" noch lauffähig sein.
es gibt ein hangcheck-delay modul mit dem man das ganze mal testen kann.


-j

Shutdown
18.09.04, 19:58
Was ist überhaupt ein Hardware-Watchdog bzw wie funktioniert sowas?
Und wenn es gut funktioniert, was kostet sowas? (Bestimmt zu viel für arme Schüler wie mich, oder?)

Shutdown

Jasper
18.09.04, 20:24
Was ist überhaupt ein Hardware-Watchdog bzw wie funktioniert sowas?
Und wenn es gut funktioniert, was kostet sowas? (Bestimmt zu viel für arme Schüler wie mich, oder?)


ein hardware-watchdog ist im einfachsten fall ein resetschalter, der eine zeitverzögerung hat, z.b. 5 sek., d.h einmal per software aktiviert muss spätestens aller 5 sek. der timer wiederum per software zurückgesetzt werden. wenn das nicht erfolgt, wird der rechner per hardware neu gestartet. luxusvarianten überwachen noch den systembus, stromversorgung, prozessor, speicher, termperaturen, fans, etc.pp.

kostet so um die 100EUR als PCI-karte. einige chipsätze wie intels ICH haben einfache watchdogs bereits an board.


-j

Shutdown
18.09.04, 20:48
Scheint ja noch im Bereich des Erschwinglichen zu liegen...weisst du zufällig auch ne URL zu einem Shop der die Dinger verkauft oder zu einem Hersteller? Da wird man ja sicher noch was erfahren können...
Danke erstmal!

Shutdown

Jasper
18.09.04, 21:00
Scheint ja noch im Bereich des Erschwinglichen zu liegen...weisst du zufällig auch ne URL zu einem Shop der die Dinger verkauft oder zu einem Hersteller? Da wird man ja sicher noch was erfahren können...


z.b. http://www.antrax.de/shop/index.htm


-j

zander
19.09.04, 08:02
In welchem Anwendungsbereich hast Du denn vor, einen hardware watchdog einzusetzen?

Shutdown
19.09.04, 10:29
Ich hab vor das Ding in einen Server und einen Remote-Client reinzubauen, an den ich von aussen nicht ohne langes durch-die-Gegend-Fahren rankomme...wenn der mal richtig hängt ist es durchaus ärgerlich...

Shutdown

Hirogen2
20.09.04, 11:44
Hangcheck_timer bringt nichts bzw. bringt's nicht -- eigene Erfahrung:
Durch eine noch ungeklärte Ursache ging eine Semaphore in **** wenn man quotaoff aufruft, wodurch das betroffene Filesystem völlig blockiert war. Mir kommt das praktisch einem Kernellock gleich (irgendwann muss jede Applikation mal auf's Rootfs zugreifen), und hangcheck_timer hat nix getan.

Jasper
20.09.04, 12:37
Hangcheck_timer bringt nichts bzw. bringt's nicht -- eigene Erfahrung:
Durch eine noch ungeklärte Ursache ging eine Semaphore in **** wenn man quotaoff aufruft, wodurch das betroffene Filesystem völlig blockiert war. Mir kommt das praktisch einem Kernellock gleich (irgendwann muss jede Applikation mal auf's Rootfs zugreifen), und hangcheck_timer hat nix getan.

dafür ist hangcheck_timer nicht gedacht (siehe anderes posting zur funktionsweise). das ist auch kein kernel-lock, der ip-stack bspw. lief garantiert weiter.


-j

Shutdown
20.09.04, 12:46
Aber eine Watchdog Karte hätte in diesem Fall (Filesystem-Hänger) wohl auch nichts unternommen, da der daemon der ihr die Signale rüberschickt ja noch "intakt" gewesen wäre, oder? :ugly:

Shutdown

Jasper
20.09.04, 13:12
Aber eine Watchdog Karte hätte in diesem Fall (Filesystem-Hänger) wohl auch nichts unternommen, da der daemon der ihr die Signale rüberschickt ja noch "intakt" gewesen wäre, oder? :ugly:


ja, die watchdog-karte hätte nichts unternommen. der daemon läuft komplett im speicher, den interessieren irgendwelche filesystemprobleme nicht.


-j