PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Debian Server rebootet ungewollt?



DarkSorcerer
20.01.04, 07:48
Hallo zusammen,

ich bin im Moment etwas verzweifelt.
Zur Vorgeschichte:

Ich habe im Geschäft ein aktuelles LAMP auf Debian woody aufgesetzt, bin nach der Anleitung im Tutorial Bereich vorgegangen, hat auch alles wunderbar geklappt:
http://www.linuxforen.de/forums/showthread.php?s=&threadid=74990

Alles läuft eigentlich super, außer das sich der PC nach einer gewissen Uptime ausschaltet. Ich kann mirs auch nicht wirklich erklären, da ich dieses Phänomen bisher noch nicht gesehen habe. Dabei ist das System eh minimalst gehalten. Es ist ein Debian woody mit folgenden laufenden Diensten:


debian:~# ps aux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 3.2 0.2 1272 484 ? S 08:11 0:04 init [2]
root 2 0.0 0.0 0 0 ? SW 08:11 0:00 [keventd]
root 3 0.0 0.0 0 0 ? SWN 08:11 0:00 [ksoftirqd_CPU0]
root 4 0.0 0.0 0 0 ? SW 08:11 0:00 [kswapd]
root 5 0.0 0.0 0 0 ? SW 08:11 0:00 [bdflush]
root 6 0.0 0.0 0 0 ? SW 08:11 0:00 [kupdated]
root 7 0.0 0.0 0 0 ? SW 08:11 0:00 [i2oevtd]
root 8 0.0 0.0 0 0 ? SW 08:11 0:00 [kjournald]
root 50 0.0 0.0 0 0 ? SW 08:12 0:00 [kapmd]
root 80 0.0 0.0 0 0 ? SW 08:12 0:00 [kjournald]
root 155 0.0 0.3 1344 596 ? S 08:12 0:00 /sbin/syslogd
root 158 0.2 0.6 2060 1232 ? S 08:12 0:00 /sbin/klogd
root 164 0.7 3.1 9768 5912 ? S 08:12 0:00 /usr/local/lamp/apache/2.0.48/bin/httpd -k start
root 169 0.0 0.2 1292 508 ? S 08:12 0:00 /usr/sbin/inetd
pgsql 183 0.0 0.9 15408 1808 ? S 08:12 0:00 /usr/local/lamp/pgsql/current/bin/postmaster -D /home/lampdata/
nobody 191 0.0 3.1 9792 5948 ? S 08:12 0:00 /usr/local/lamp/apache/2.0.48/bin/httpd -k start
nobody 192 0.0 3.1 9792 5948 ? S 08:12 0:00 /usr/local/lamp/apache/2.0.48/bin/httpd -k start
nobody 193 0.0 3.1 9792 5948 ? S 08:12 0:00 /usr/local/lamp/apache/2.0.48/bin/httpd -k start
nobody 194 0.0 3.1 9792 5948 ? S 08:12 0:00 /usr/local/lamp/apache/2.0.48/bin/httpd -k start
root 195 0.0 0.6 2784 1208 ? S 08:12 0:00 /usr/sbin/sshd
nobody 197 0.0 3.1 9792 5948 ? S 08:12 0:00 /usr/local/lamp/apache/2.0.48/bin/httpd -k start
pgsql 200 0.0 0.8 6208 1596 ? S 08:12 0:00 postgres: stats buffer process
pgsql 201 0.0 0.8 5268 1628 ? S 08:12 0:00 postgres: stats collector process
root 202 0.0 0.5 2180 1084 ? S 08:12 0:00 /bin/sh /usr/local/lamp/mysql/4.0.17/bin/mysqld_safe --datadir=
daemon 207 0.0 0.3 1384 580 ? S 08:12 0:00 /usr/sbin/atd
root 210 0.0 0.2 1252 468 tty1 S 08:12 0:00 /sbin/getty 38400 tty1
root 211 0.0 0.2 1252 468 tty2 S 08:12 0:00 /sbin/getty 38400 tty2
root 212 0.0 0.2 1252 468 tty3 S 08:12 0:00 /sbin/getty 38400 tty3
root 213 0.0 0.2 1252 468 tty4 S 08:12 0:00 /sbin/getty 38400 tty4
root 214 0.0 0.2 1252 468 tty5 S 08:12 0:00 /sbin/getty 38400 tty5
root 215 0.0 0.2 1252 468 tty6 S 08:12 0:00 /sbin/getty 38400 tty6
mysql 236 0.4 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 238 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 239 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 240 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 241 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 242 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 243 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 244 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 245 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
mysql 246 0.0 6.1 45824 11784 ? S 08:12 0:00 /usr/local/lamp/mysql/4.0.17/libexec/mysqld --basedir=/usr/loca
root 247 0.1 0.9 5724 1784 ? S 08:12 0:00 /usr/sbin/sshd
root 249 0.0 0.6 2216 1244 pts/0 S 08:13 0:00 -bash
root 253 0.0 0.8 3564 1584 pts/0 R 08:14 0:00 ps aux

Ein X-Server ist erst gar nicht installiert, ich administrier die Kiste via SSH.

Nachdem mir das jetzt schon 3x aufgefallen ist hab ich mich jeweils immer über die Log hergemacht, die folgendes sagt:
(/var/log/messages)
http://nopaste.php-q.net/35807

Wie ihr in der Log seht hat sich der Server gestern, 19. Januar um 20:25, danach 20:47 und dann 20:48 neu gestartet.
Den letzten Restart hat er anscheinend nicht mehr mitgemacht und hat sich ausgeschaltet.

Als dies das erste mal passiert ist, stand dabei noch die services discard, daytime und time, die ich in der /etc/services auskommentiert habe. Also hab ich erst mal hier angefangen, den Kommentar wieder rauszunehmen, nmap zeigt nun folgendes Bild:


debian:~# nmap localhost

Starting nmap V. 2.54BETA31 ( www.insecure.org/nmap/ )
Interesting ports on localhost (127.0.0.1):
(The 1548 ports scanned but not shown below are in state: closed)
Port State Service
9/tcp open discard
13/tcp open daytime
22/tcp open ssh
37/tcp open time
80/tcp open http
3306/tcp open mysql


Nmap run completed -- 1 IP address (1 host up) scanned in 0 seconds


Da dies aber auch nicht zum Erfolg führte und der Server wieder aus war, als ich morgens das Büro reinkam, hab ich mir cron vorgenommen. Ich habe keinerlei cronjobs, das sind die default debian cronjobs in der /etc/crontab. Trotzdem habe ich cron mal deaktiviert. Und wie ich heute morgen gesehen habe, auch kein Erfolg.

Ich kann ausschließen, dass irgendwer an dem Server rumgespielt hat. Der Raum war abgeschlossen, die Kennwörter kenne nur ich und ein "last" gibt mir folgendes:


debian:~# last |head
root pts/0 193.99.208.213 Tue Jan 20 08:13 still logged in
reboot system boot 2.4.18-bf2.4 Tue Jan 20 08:12 (00:20)
root tty1 Tue Jan 20 08:11 - down (00:00)
reboot system boot 2.4.18-bf2.4 Tue Jan 20 08:10 (00:00)
reboot system boot 2.4.18-bf2.4 Mon Jan 19 20:48 (11:22)
reboot system boot 2.4.18-bf2.4 Mon Jan 19 20:47 (11:24)
reboot system boot 2.4.18-bf2.4 Mon Jan 19 20:25 (11:45)
reboot system boot 2.4.18-bf2.4 Mon Jan 19 19:56 (12:15)
reboot system boot 2.4.18-bf2.4 Mon Jan 19 19:28 (12:42)
root pts/0 193.99.208.213 Mon Jan 19 08:22 - 16:49 (08:26)



Wie man sieht wurde am gestrigen 19. Jan einige male rebootet. Die 193.99.* ist meine IP, mit der ich gestern zwischen 08:22 und 16:49 via ssh auf dem Server eingeloggt war. Um 19:28 beginnen dann die Reboots, bis er 20:48 dann nicht mehr die Kurve bekommen hat und sich ausschaltete. Wie ihr seht war sonst keine eingeloggt.

Die /var/log/syslog offenbart mir ein ähnliches Bild wie die messages. Hier immer die Stellen der reboots:


Jan 19 19:56:06 debian kernel: kjournald starting. Commit interval 5 seconds
Jan 19 19:56:06 debian kernel: EXT3 FS 2.4-0.9.17, 10 Jan 2002 on ide0(3,2), internal journal
Jan 19 19:56:06 debian kernel: EXT3-fs: mounted filesystem with ordered data mode.
Jan 19 20:16:05 debian -- MARK --
Jan 19 20:25:36 debian syslogd 1.4.1#10: restart.
Jan 19 20:25:36 debian kernel: klogd 1.4.1#10, log source = /proc/kmsg started.
Jan 19 20:25:36 debian kernel: Inspecting /boot/System.map-2.4.18-bf2.4
.
.
.
Jan 19 20:25:37 debian kernel: kjournald starting. Commit interval 5 seconds
Jan 19 20:25:37 debian kernel: EXT3 FS 2.4-0.9.17, 10 Jan 2002 on ide0(3,2), internal journal
Jan 19 20:25:37 debian kernel: EXT3-fs: mounted filesystem with ordered data mode.
Jan 19 20:47:02 debian syslogd 1.4.1#10: restart.
Jan 19 20:47:03 debian kernel: klogd 1.4.1#10, log source = /proc/kmsg started.
Jan 19 20:47:03 debian kernel: Inspecting /boot/System.map-2.4.18-bf2.4
.
.
.
Jan 19 20:47:03 debian kernel: kjournald starting. Commit interval 5 seconds
Jan 19 20:47:03 debian kernel: EXT3 FS 2.4-0.9.17, 10 Jan 2002 on ide0(3,2), internal journal
Jan 19 20:47:03 debian kernel: EXT3-fs: mounted filesystem with ordered data mode.
Jan 19 20:48:33 debian syslogd 1.4.1#10: restart.
Jan 19 20:48:33 debian kernel: klogd 1.4.1#10, log source = /proc/kmsg started.
Jan 19 20:48:33 debian kernel: Inspecting /boot/System.map-2.4.18-bf2.4
Jan 20 08:10:28 debian syslogd 1.4.1#10: restart.
Jan 20 08:10:28 debian kernel: klogd 1.4.1#10, log source = /proc/kmsg started.
Jan 20 08:10:28 debian kernel: Inspecting /boot/System.map-2.4.18-bf2.4


Ich frage mich, was will der syslogd von mir. Warum startet der den Server andauernd neu.

Vielleicht ist auch noch ein lsmod interessant:


debian:~# lsmod
Module Size Used by Not tainted
apm 9148 0 (unused)
smbfs 31296 0 (unused)
msdos 4668 0 (unused)
3c59x 24648 1
mousedev 3776 0 (unused)
input 3072 0 [mousedev]
agpgart 29824 0 (unused)


lspci sagt folgendes:


debian:~# lspci
00:00.0 Host bridge: Acer Laboratories Inc. [ALi] M1541 (rev 04)
00:01.0 PCI bridge: Acer Laboratories Inc. [ALi] M5243 (rev 04)
00:03.0 Bridge: Acer Laboratories Inc. [ALi] M7101 PMU
00:07.0 ISA bridge: Acer Laboratories Inc. [ALi] M1533 PCI to ISA Bridge [Aladdin IV] (rev c3)
00:09.0 Ethernet controller: 3Com Corporation 3c905B 100BaseTX [Cyclone] (rev 30)
00:0f.0 IDE interface: Acer Laboratories Inc. [ALi] M5229 IDE (rev c1)
01:00.0 VGA compatible controller: Matrox Graphics, Inc. MGA G200 AGP (rev 03)


Wie gesagt bin ich zur Zeit am verzweifeln. Ich habe auch schon die Hardware überprüft, Speicher habe ich getauscht gegen neuen, kein Erfolg.
Denn ich habe eigentlich vorgehabt meinen Chef von nem LAMP zu überzeugen, er wollte nämlich vorher nen Win2k-Server haben... nur wenn der andauernd rebootet wirds wohl doch Win2k werden.

Vielleicht hat einer von euch noch nen Tipp woran das liegen könnte.

Danke für jegliche Hilfe... ich will kein Windows! :)

`kk
20.01.04, 07:55
Ich denke mal jemand zu überzeugen, dass Linux die bessere Wahl als Server ist dürfte nicht so schwer sein.

Dumme Frage, aber hast du nen Cron laufen? :ugly:

DarkSorcerer
20.01.04, 07:59
Original geschrieben von `kk
Ich denke mal jemand zu überzeugen, dass Linux die bessere Wahl als Server ist dürfte nicht so schwer sein.

Dumme Frage, aber hast du nen Cron laufen? :ugly:
Wenn der Server astrein läuft wird das kein Problem sein mit dem Überzeugen.
Wie ich schon geschrieben habe läuft zur Zeit kein crond, da ich diesen deaktiviert habe:


debian:~# ps aux | grep cron
root 274 0.0 0.2 1336 436 pts/0 S 08:57 0:00 grep cron



Und die /etc/crontab besteht nur aus den default Debian cronjobs, da sollte eigentlich keiner dabei sein, der den Rechner neu startet...

DarkSorcerer
20.01.04, 08:19
Aha, und eben hab ich das tatsächlich live miterleben dürfen. Plötzlich piept es hinter mir. Der Rechner rebootet.
Ich verfolge die Bootmessages, und mittendrin, noch bevor die Dienste starten, bootet er wieder neu. Dann das gleiche Spiel noch mal, bootet wieder während den Bootmessages und jetzt steht er wieder am login prompt... ma gespannt wann er sich ausschaltet.

Kann es sein das die HDD nen defekt hat? Sie hört sich zwar ganz normal an, aber man soll ja nichts ausschließen.

Columbo0815
20.01.04, 08:22
Hi,

hast du eine die Möglichkeit eine USV dranzuhängen? Könnte der RAM defekt sein?

Gruß Columbo

Columbo0815
20.01.04, 08:24
Hab mir nochmal die logs angeschaut... Der bekommt ja einen Befehl zum neustarten und startet nicht einfach so neu :ugly:

Was gibt denn "users" aus? Hängt eine USV dran, von der er den Befehl bekommen könnte?

Gruß Columbo

DarkSorcerer
20.01.04, 08:29
Original geschrieben von Columbo0815
Hi,

hast du eine die Möglichkeit eine USV dranzuhängen? Könnte der RAM defekt sein?

Gruß Columbo
Hi Columbo,

also am Saft sollte es auch nicht liegen. Der Server hängt am gleichen Stromkreis wie mein Desktop hier, der bootet auch nicht einfach neu. Und er fährt ja auch schön ordnungsgemäß runter, also "reboot". Er schaltet sich nicht einfach so aus.

Ein Speicherproblem hatte ich, als ich Apache, MySQL etc kompilierte. Diese brachen immer mit Segfaults ab. Also Speicher getauscht und seit dem hat alles wunderbar durchkompiliert. Von daher schließe ich den Speicher aus. Ich muss mich ma umschauen, ich glaub ich hätt auch gar keine anderen Module mehr da zum testen.

DarkSorcerer
27.01.04, 08:36
Zur Info:
Nachdem ich alle Hardwarekomponenten durchgecheckt habe kam ich irgendwann nach dem Netzteil beim Mainboard an, und siehe da, seit dem Tausch des Mainboards läuft der Server tadellos.