PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Mysteriöse Abstürze



Webfan
18.08.01, 16:44
Hi,

ich habe ein größeres Problem. Ich hab @home ein kleines Lan und einen Router mit 2 Netzwerkkarten... Der Router läuft auch fast perferkt nur nach gut ca. 10 Tagen Uptime verabschiedet er sich schonma einfach so mal mit folgender Fehlermeldung. Ich kann es mir einfach nicht erklären woran es liegen könnte. Also wenn ich mich dann auf dem Rechner einloggen will um nachzusehen was los ist, kann ich noch den username eingeben jedoch die Abfrage nach Passwort erscheint gar nicht mehr. Selbst das Wechseln der Konsolen ist noch möglich. Über Netzwerk ist er auch nicht mehr ansprechbar...



Vor dem Absturz bzw. während
Aug 18 17:15:38 server kernel: Unable to handle kernel paging request at virtual address 40bbec64
Aug 18 17:15:38 server kernel: current->tss.cr3 = 03bea000, %%cr3 = 03bea000
Aug 18 17:15:38 server kernel: *pde = 00000000
Aug 18 17:15:38 server kernel: Oops: 0002
Aug 18 17:15:38 server kernel: CPU: 0
Aug 18 17:15:38 server kernel: EIP: 0010:[dput+80/352]
Aug 18 17:15:38 server kernel: EFLAGS: 00010203
Aug 18 17:15:38 server kernel: eax: 40bbec60 ebx: c0bbec40 ecx: c0bbec60 edx: c0bbec60
Aug 18 17:15:38 server kernel: esi: 00000000 edi: 00000a03 ebp: fffffc6a esp: c3b93cac
Aug 18 17:15:38 server kernel: ds: 0018 es: 0018 ss: 0018
Aug 18 17:15:38 server kernel: Process sendmail (pid: 385, process nr: 21, stackpage=c3b93000)
Aug 18 17:15:38 server kernel: Stack: 00000018 ffffff0b c0137310 00000010 00000283 c013760b c0bbec40 c0d9b
Aug 18 17:15:38 server kernel: c3b93d30 00000000 00000000 c4f89f20 00000a05 c3b93d30 c013852c 00000
Aug 18 17:15:38 server kernel: 00000001 00000a05 c4f89f20 00000a05 c3b93d30 c0138672 00000000 00000
Aug 18 17:15:38 server kernel: Call Trace: [dput+0/352] [prune_dcache+311/360] [__free_inodes+28/104] [try
Aug 18 17:15:38 server kernel: [get_new_inode+151/324] [get_new_inode+209/324] [iget4+125/136] [ige
Aug 18 17:15:38 server kernel: [proc_lookup+142/196] [proc_root_lookup+74/268] [real_lookup+91/216]
Aug 18 17:15:38 server kernel: [sys_open+63/160] [sys_open+38/160] [sys_time+19/32] [system_call+52
Aug 18 17:15:38 server kernel: Code: 89 50 04 89 02 8d 43 18 39 43 18 0f 85 a3 00 00 00 8b 53 2c



Start nach dem Absturz
Aug 18 17:21:45 server kernel: ne2k-pci.c: PCI NE2000 clone 'RealTek RTL-8029' at I/O 0xff40, IRQ 12.
Aug 18 17:21:45 server kernel: eth0: RealTek RTL-8029 found at 0xff40, IRQ 12, 00:4F:49:00:7C:18.
Aug 18 17:21:47 server kernel: parport0: detected irq 7; use procfs to enable interrupt-driven operation.


Beide Meldungen stammen aus /var/log/warn

Hängt es vielleicht mit meiner Netzwerkkarte zusammen?!?!??!

Würde mich über Hilfe freuen.

Danke.

Webfan
20.08.01, 20:42
bitte nach "allgemein" verschieben.

danke...

Catonga
21.08.01, 04:45
Also ich tippe auf einen Bug im Linux Kernel.


Was für eine Kernel Version hast du denn?

Falls du noch eine ältere Version installiert hast, empfehle ich dir diese upzudaten.

Bei einem alten 2.2.x Kernel auf Kernel 2.2.19.
Bei einem alten 2.4.x Kernel auf Kernel 2.4.9.


Von 2.2.x auf 2.4.x updaten würde ich auf keinen Fall machen, in der Regel ist der 2.2.19 nämlich sowiso etwas ausgereifter und bugfreier. Daher sehr zu empfehlen für Router.


Falls es aber schon einer neusten Kernel ist(also 2.4.9 oder 2.2.19), dann
solltest du am besten einen Bug Report an die Kernel Developer schreiben.


Dazu soviele Informationen wie möglich mit angeben. (auch diesen Output da oben)
Wie das genau geht mit dem Bugreport und wohin steht in /usr/src/linux/README drin.

philippmueller
21.08.01, 12:01
Falls es der 2.4 ist:

Hast Du Deinen Swap-Speicher auch sicher größer als 2 mal Deinem RAM?

"Unable to handle kernel paging request at virtual address"

klingt eben nach Swap-Problem.

sauron
21.08.01, 13:54
Hi,
ich halte es ehr für unwahrscheinlich das das problem am swap liegt. So wie es aussieht hat sendmail in deinen ram schreiben/lesen wollen und ist dabei abgeschmiert. wenn das problem häufig, nicht nur bei sendmail und vor allem unvorhersehbar und nicht reproduzierbar ist würde ich mal den speicher, wenn es denn noname speicher ist, gegen guten marken speicher austauschen oder einen speichertest machen

Webfan
21.08.01, 16:49
also ich verwende den 2.2.19 kernel.

auf 2.4 kann ich bzw. will ich net updaten weil dann meine alten ipchains-rules bei draufgehen :(

wie gesagt das problem tritt unvoraussehbar auf. wo kann ich ein solches speicher-testprog finden? nämlich die edo's sind net gerade billig *g*

ps: es rennt suse 7.2 prof...

[ 21. August 2001: Beitrag editiert von: Webfan ]

Ulli Ivens
21.08.01, 17:26
Dann hau mal die erste CD (oder die DVD ) rein und boote davon. Da ist das Programm Memtest drauf !!

Direkt bei der "tollen" grafischen auswahl vom Lilo !!

Dabei solltest du aber Zeit mitbringen, da das lange dauert. Habe das mal über Nacht laufen lassen und es war am morgen immer noch nicht fertig !!

Viel Erfolg bei der Fehlersuche !!

Webfan
21.08.01, 19:28
also hab mal das memtest von suse laufen lassen. leider net ganz durch weil die zeit fehlte. jedenfalls zeigte er mit nach 3 std. 3x "pass" an... was kann ich daraus schließen?

Catonga
21.08.01, 21:21
Das der Memorytest 3 mal bestanden hat.

Kommt jetzt halt darauf an, ob der Rechner schon länger an war.
Wär nöglich das er nach 20 Stunden zu warm wird und erst dann der Speicher versagt.


Probiers mal mit nem Bug Report an die Kernel-Devel Liste, die kennen sich wesentlich besser aus.

Webfan
28.08.01, 17:11
SuSE scheint das Problem nicht zu interessieren. Eine Antwort blieb bis jetzt aus :-(

Sonst noch jemand ideen?

panzi
28.08.01, 23:15
Ich möchte hirzu nur eins bemerken:
10 Tage uptime???
Unter Win muss ich mich freun wenn ich 10 Stunden überstehe!
:)

philippmueller
30.08.01, 14:24
Ich halte einen Hardwaredefekt nun nicht für die Ursache. 10 Tage sind einfach zu lang, wenn es Wärme wäre, dann sollte das viel früher auftreten.

Der 2.2.19'er sollte auch richtig stabil sein.

Die Fehlermeldung "Unable to handle..." sagt auch ungefähr aus, daß er keinen Speicher mehr bekommt.

Also denke ich, daß Du irgendeine Software laufen hast, die ständig mehr Speicher verbraucht und zum Schluß Dir der Speicher ausgeht. Vieleicht startest Du ja auch ständig neue Prozeße, ohne daß der alte gelöscht wurde.

Prüfe doch einfach mal nach 5-10 Tagen den Speicherverbrauch der Anwendungen und viele Prozeße dann laufen.

Philipp

Krelian
30.08.01, 18:07
Die Meldung "Unable to handle kernel paging request at virtual address xxxxxx" habe ich auch schon mal gesehen.

Das war bei einem Rechner, dessen Prozessor im Eimer war.
Allerdings trat diese Meldung direkt beim Booten auf.