PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Mein CentOS stürzt neuerdings zuverlässig ab - Warum?



E.coli
05.09.10, 12:04
Hi,

seit über einem Jahr nutze ich auf meinem Desktopr CentOS 5, das gegenwärtig auf dem aktuellen Stand der Updates ist (also 5.5 - bis auf den Kernel sowie OpenOffice). Allerdings habe ich noch einige zusätzliche Paketquellen eingebunden, so dass ich bislang den Kernel:
2.6.18-128.2.1.el5.centos.plus
verwendet habe. Ausserdem habe ich noch eine Nvidia-Graphikkarte und daher nutze ich den Nvidia-Treiber:
NVIDIA-Linux-x86-185.18.31

Bislang lief das System zuverlässig. Nur treten in letzter Zeit reproduzierbar Abstürze auf, wobei das System vollständig einfriert auch ein Zugriff über das Netzwerk ist nicht mehr möglich (ping liefert keine Rückmeldung). Dies tritt gegenwärtig bei jedem Neustart des Systems auf, vorausgesetzt, der PC wurde zuvor normal heruntergefahren. Ist das System einmal eingefroren hilft nur noch ein Hardware-Reset. Wird der PC nun erneut gestartet, so läuft das System normal, ohne einzufrieren. Nachdem der PC dann normal heruntergefahren wurde, friert er bei dem nächsten Start wieder ein.

Mein erster Verdacht war, dass ein Problem mit dem X-Server vorläge und bei einem Update bestimmte Komponenten des Nvidia-Treibers duch das Update überschrieben worden wären (dieses Problem ist bekannt und lag bei mir auch vor, denn ein Programm - PyMOL - lief nach einem Update nicht mehr). Also habe ich den Nvidia-Treiber erneut installiert (danach lief PyMOL wieder). Allerdings konnte das Problem eines einfrierenden Systems hierdurch nicht behoben werden.
Ich vermute daher, dass der X-Server nicht das Problem ist, zumal nicht nur die graphische Oberfläche einfriert, sondern auch ein Netzwerkzugriff nicht mehr gelingt.

Ich habe /var/log/messages überprüft um einen Anhaltspunkt über die Ursache zu erhalten, bin jedoch nicht fündig geworden. Daher hier ein Auszug aus dieser Datei, bis zu dem Absturzt des Systems:



Sep 5 12:14:06 centos ntpd[2800]: kernel time sync status 0040
Sep 5 12:14:06 centos gpm[2836]: *** info [startup.c(95)]:
Sep 5 12:14:06 centos gpm[2836]: Started gpm successfully. Entered daemon mode.
Sep 5 12:14:07 centos ntpd[2800]: frequency initialized 29.057 PPM from /var/lib/ntp/drift
Sep 5 12:14:07 centos avahi-daemon[2930]: Found user 'avahi' (UID 70) and group 'avahi' (GID 70).
Sep 5 12:14:07 centos avahi-daemon[2930]: Successfully dropped root privileges.
Sep 5 12:14:07 centos avahi-daemon[2930]: avahi-daemon 0.6.16 starting up.
Sep 5 12:14:07 centos avahi-daemon[2930]: WARNING: No NSS support for mDNS detected, consider installing nss-mdns!
Sep 5 12:14:07 centos avahi-daemon[2930]: Successfully called chroot().
Sep 5 12:14:07 centos avahi-daemon[2930]: Successfully dropped remaining capabilities.
Sep 5 12:14:07 centos avahi-daemon[2930]: No service found in /etc/avahi/services.
Sep 5 12:14:07 centos avahi-daemon[2930]: New relevant interface eth0.IPv6 for mDNS.
Sep 5 12:14:07 centos avahi-daemon[2930]: Joining mDNS multicast group on interface eth0.IPv6 with address fe80::20d:88ff:feb3:e7d7.
Sep 5 12:14:07 centos avahi-daemon[2930]: New relevant interface eth0.IPv4 for mDNS.
Sep 5 12:14:07 centos avahi-daemon[2930]: Joining mDNS multicast group on interface eth0.IPv4 with address 192.168.0.12.
Sep 5 12:14:07 centos avahi-daemon[2930]: Network interface enumeration completed.
Sep 5 12:14:07 centos avahi-daemon[2930]: Registering new address record for fe80::20d:88ff:feb3:e7d7 on eth0.
Sep 5 12:14:07 centos avahi-daemon[2930]: Registering new address record for 192.168.0.12 on eth0.
Sep 5 12:14:07 centos avahi-daemon[2930]: Registering HINFO record with values 'I686'/'LINUX'.
Sep 5 12:14:09 centos avahi-daemon[2930]: Server startup complete. Host name is centos.local. Local service cookie is 661653560.
Sep 5 12:14:18 centos smartd[3045]: smartd version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Sep 5 12:14:18 centos smartd[3045]: Home page is http://smartmontools.sourceforge.net/
Sep 5 12:14:18 centos smartd[3045]: Opened configuration file /etc/smartd.conf
Sep 5 12:14:18 centos smartd[3045]: Configuration file /etc/smartd.conf was parsed, found DEVICESCAN, scanning devices
Sep 5 12:14:18 centos smartd[3045]: Device: /dev/hda, opened
Sep 5 12:14:18 centos smartd[3045]: Device: /dev/hda, found in smartd database.
Sep 5 12:14:18 centos smartd[3045]: Device: /dev/hda, is SMART capable. Adding to "monitor" list.
Sep 5 12:14:18 centos smartd[3045]: Device: /dev/hdb, opened
Sep 5 12:14:18 centos smartd[3045]: Device: /dev/hdb, found in smartd database.
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/hdb, is SMART capable. Adding to "monitor" list.
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/hdc, opened
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/hdc, packet devices [this device CD/DVD] not SMART capable
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/hdd, opened
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/hdd, packet devices [this device CD/DVD] not SMART capable
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sda, opened
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sda, NO MEDIUM present; skip device
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sdb, opened
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sdb, NO MEDIUM present; skip device
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sdc, opened
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sdc, NO MEDIUM present; skip device
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sdd, opened
Sep 5 12:14:19 centos smartd[3045]: Device: /dev/sdd, NO MEDIUM present; skip device
Sep 5 12:14:19 centos smartd[3045]: Monitoring 2 ATA and 0 SCSI devices
Sep 5 12:14:20 centos smartd[3055]: smartd has fork()ed into background mode. New PID=3055.
Sep 5 12:14:21 centos pcscd: winscard.c:304:SCardConnect() Reader E-Gate 0 0 Not Found
Sep 5 12:14:21 centos last message repeated 3 times
Sep 5 12:14:21 centos kernel: agpgart: Found an AGP 2.0 compliant device at 0000:00:00.0.
Sep 5 12:14:21 centos kernel: agpgart: Putting AGP V2 device at 0000:00:00.0 into 4x mode
Sep 5 12:14:21 centos kernel: agpgart: Putting AGP V2 device at 0000:01:00.0 into 4x mode
Sep 5 12:17:24 centos ntpd[2800]: synchronized to 131.188.3.220, stratum 1
Sep 5 12:17:23 centos ntpd[2800]: time reset -0.435483 s
Sep 5 12:17:23 centos ntpd[2800]: kernel time sync enabled 0001
Sep 5 12:21:15 centos ntpd[2800]: synchronized to LOCAL(0), stratum 10
Sep 5 12:22:11 centos kernel: NVRM: Xid (0001:00): 6, PE0000 0880 ff15335e 00001910 00000000 ff15335e
Sep 5 12:22:11 centos kernel: NVRM: Xid (0001:00): 6, PE0000 097c ff15335e 00000000 00000000 00000000
Sep 5 12:22:11 centos kernel: NVRM: Xid (0001:00): 3, C 00000000 SC 00000006 M 00000184 Data e0010200

Ein Neustart beginnt dann mit diesen Aufzeichnungen in /var/log/messages:


Sep 5 12:27:19 centos syslogd 1.4.1: restart.
Sep 5 12:27:19 centos kernel: klogd 1.4.1, log source = /proc/kmsg started.
Sep 5 12:27:19 centos kernel: Linux version 2.6.18-128.2.1.el5.centos.plus (mockbuild@builder16.centos.org) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-44))
#1 SMP Thu Jul 16 07:24:16 EDT 2009
Sep 5 12:27:19 centos kernel: BIOS-provided physical RAM map:

Ich bin um jeden Hinweis dankbar. Sollten noch weiter Daten zur Lósung des Problems nötig sein, reiche ich diese schnellst möglich nach.

Danke und Grüße
E. coli

ThorstenHirsch
05.09.10, 12:11
Gab's da nicht mal ein Problem mit ner Intel-Netzwerkkarte, die bei jedem richtigen Herunterfahren etwas ins EEPROM geschrieben hatte, das ein anschließendes Hochfahren crashen ließ? Hab' da dunkel was in Erinnerung.

Etwas gröber gesagt: ich schätze, es liegt an Hardware/Kernel/Treiber, aber nicht an RAM/CPU/Netzteil.

E.coli
05.09.10, 12:17
Das der Fehler bei der Hardware liegt glaube ich auch nicht.

Meine Netzwerkkarte ist nicht von Intel, eine ist von Via, die andere von D-Link. Der PC selbst ist von 2002 (P4).

pferdefreund
06.09.10, 05:38
Die ist ja auch schon wohl länger drin und es hat bisher ja immer funktioniert.
Um Grafikprobleme auszuschließen, einfach mal nach dem Runterfahren in einem Runlevel booten,
der keine Grafik beinhaltet und als boot-Parameter vga=normal mitgeben, damit kein
Framebuffer verwendet wird.