PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Server Monitoring



noble
28.07.06, 09:40
Hallo zusammen!

Also es wird endlich Zeit ;) das ich anfange Hardware und Traffic sauber zu monitoren. Viele Einzeltools und das lesen von Log Files wird auf dauer fad und ist auf die schnelle nicht sehr komfortabel ;) vorallem wenn man nicht per SSH auf den Server kommt.

Aus diesem Grund suche ich nach Tools die mir hier eine graphische Aufbereitung machen.

rrdtool hab ich herausgefunden erledigt mir das sammeln der daten.

nun stellt sich die frage welches tool die grafische aufbereitung macht.
cacti, munin und serverstats hab ich da gefunden

nur welches sollte man einsetzen bzw. nach welchen kriterien wählen.

überwachen will ich traffic, user zahl, cpu load und hardware wie hdd, cpu, temperatuer und co.

vorerst ist eine remote überwachung nicht nötig es würde mal reichen wenn der lokale server überwacht wird vom server aus.

weiters wäre es auch nette wenn es möglichkeit gäbe, zB bei einer cpu last von über 90% automatisiert zB apache zu stoppen und ein mail zu versenden.

also was hättet ihr für tipps für mich ?

danke

marce
28.07.06, 09:52
nagios kannst Du auch in die Liste noch aufnehmen.

Ansonsten - welches Du nun nimmst - das bleibt eigentlich Dir überlassen, je nach Anforderungen.

Bei uns z.B. laufen lokale Monitorscripte (so wie das von Dir gewünschte 90%-Script), nagios und mrtg - demnächst evtl. noch tellu.

cane
28.07.06, 09:52
Nur überwachen und grafisch darstellen: Cacti.

Automatisiert banachrichtigen oder andere Aktionen ausführen und weitaus mächtiger: Nagios

http://nagios.org
http://nagios-portal.de
http://nagios-wiki.de

mfg
cane

noble
28.07.06, 10:14
das problem bei nagios ist, das es mir fürs erste doch noch eine spur zu komplex und kompliziert ist. soweit meine ersten erfahrungen und gehversuche vor einigen monaten oder sogar jahren *grübel*

aber mich würde interessieren nach welchen kriterien ich entscheiden soll welche der sagen wir mal 4 applications ich nehme.

ok nagios setz ich ein sobald ich das zB 90% cpu usage script haben will.

abgesehen davon - welche kriterien sprechen für was - oder is alles gut und nur mehr geschmackssache ?

marce
28.07.06, 10:20
die meisten Überwachungsscripte liefer die 90%-Funktion nicht mit - da wirst Du über lokale Scripte meist nicht rumkommen...

Nagios ist an sicht nicht komplex - eine funktionierende Installation hat man nach ca. 1h am laufen, bis dann alle Feinheiten drin sind - würde mal sagen 1 Tag.

Entscheidend sind einfach Deine Anforderungen: Historie, Art der Darstellung, ... - aber da können wir Dir echt nicht helfen, jedenfalls nicht, solange Du uns konkret sagst, was Du denn genau wie überwacht und dargestellt haben willst. Die von Dir oben genannten Anforderungen können aller der Produkte (bis auf das lokale Monitoring)

crusa4der
28.07.06, 10:23
www.netmrg.net kannst du dir mal anschauen ob es bei deinen Ansprüchen in frage kommt! Ich verusche es mir noch verzweifelt zu installieren. (Dabei hängt es aber nicht an netmrg selber, sondern andere Programme machen mir Probleme)

noble
28.07.06, 10:42
dann versuch ich das mal genauer zu beschreiben :
also vorerst will ich dass mal auf einem server installen den ich dann auch überwache. zugriff per http(s) hatten wir schon.

was will ich überwachen:
* traffic der nic
* uptime des servers
* auslastung des server
** einzelnen prozesse und deren cpu zeit
** allgemein verbratene cpu zeit und usage
* hdd informationen
** hdd temp
** hdd smart status im gesamten
** hdd read / write auslastung
* allgemeine hardware infos (zB: MB temp, was halt hier die hardware anbietet)
* einzelne prozesse (hier auch incoming outgoing traffic)
** apache und auslastung
** mailsystem auslastung
** SSH

und das ganze halt soweit geht mit graphen damit ich den verlauf der letzten wochen bzw. monate sehe.

is das mal ein anfang ?

cane
28.07.06, 10:54
die meisten Überwachungsscripte liefer die 90%-Funktion nicht mit - da wirst Du über lokale Scripte meist nicht rumkommen...

Die man ja unter Nagios per NRPE, check_by_ssh oder eventuell NSCA bzw. einem Agenten ausführen lassen kann.


Nagios ist an sicht nicht komplex - eine funktionierende Installation hat man nach ca. 1h am laufen, bis dann alle Feinheiten drin sind - würde mal sagen 1 Tag.

Innerhalb eines Tages bekommt man vielleicht die dienste gfemonitored und ein paar abhängigkeiten definiert aber eine komplett mit nagios gemonitorte Umgebung zu realisieren dauert schon seine Zeit, allein schon der Einarbeitungsaufwand... Macht man Fehler was checkintervalle von Service- oder Host-Dependencies angeht hat man schnell Fehlalame produziert, es gibt schon ein paar Kniffe...

Fazit: Nagios ist sehr mächtig - will man komplexe Umgebungen monitoren sollte man aber zeit für Einarbeitung einplanen oder einen externen dienstleister mit Kernkompetenz in diesem bereich beauftragen.

Es gibt übrigens auch kommerzielle Lösungen die auf Nagios aufsetzen, Groundwork bietet da einige an.

mfg
cane

marce
28.07.06, 10:59
@cane: klar - kommt wahrscheinlich drauf an, wie erfahren man mit dem System ist und wie komplex die Umgebung ist. Hier bei uns monitoren wir nur "einfache" Web-Dienste und die notwendingen Betriebsystem-Dienste und haben dann auch noch recht viele parallele Installationen. Wenn man natürlich 300 Individualsystem hat sieht's ein bisserl anders aus.

check_by_ssh und so ist nett - aber ich würde lieber lokal überwachen und remote monitoren - aus meiner Sicht weniger Fehleranfällig.

cane
28.07.06, 11:45
Stimme ich zu - maßgebend ist die Komplexität der umgebung. Daneben aber auch wie weit man automatisieren will - ist schon ganz nett wenn der Tomcat hängt und sofort ein Eventhandler ausgeführt wird der per check_by_ssh den deamon neu hochjagt...

mfg
cane