PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Hängender Server



E S
15.05.04, 22:04
Hi,

ich habe ein Problem mit meinem SuSE (8.1) Linuxrouter. nach etwa ein bis drei Wochen Laufzeit scheint der sich irgendwie aufzuhängen. Der Windowsclient kann Samba nicht mehr benutzen, der Browser findet den Apache nicht mehr und auch der Proxy Squid ist nicht mehr erreichbar.

SSH funktioniert nich, cinternet --status sagt disconected und demand = 1. Trotzdem will er keine DSL-Verbindung aufbauen. rcsamba, rcsquid, rcnamed und rcapache sagen aber running.

Befehle ich cinternet --start, so ändert sich der Status in lurking, was immer das auch genau heisst (lurking = lauernd). Auch nach langer wartezeit ändert sich nichts.

Biostemperatur scheint in ordnung zu sein, Filesystem auch.

Einzige Abhilfe bietet nur der befehl reboot, dann ist der Server in weniger als 5 min wieder erreichbar und funktioniert einwandfrei.

Es scheint fast so, als wenn die Dienste gar nicht mehr auf die Netzwerkkarten reagieren (ausser ssh). ping ist in Ordnung.

Unanbhängig davon habe ich seit 2 Wochen Ärger mit dem SQUID. Bei einer angeforderten Webseite passiert erst mal nichts, dann erscheint die Webseite nach 10-20 Sekunden sofort. Surfen innerhalb einer URL geht alles rasend schnell. Ich habe den Bind9 im verdacht, kann aber nichts ungewöhnliches feststellen.

Wer kann mir helfen?

Gruß
Elmar

geronet
16.05.04, 10:46
Aber lokalen Zugriff über Konsole hast du oder?

Schau dir mal "ifconfig" an ob irgendwelche Errors oder Drops vorhanden sind wenn er wieder hängt, probier dann auch einfach mal "ifconfig eth0 down", "ifconfig eth0 up" etc.. für die entsprechende Karte (danach wieder routen neu setzen).

Wie siehts mit dem Speicher aus? Oder Festplattenplatz? Wird aber eher die Netzwerkkarte sein. Wenn du mal viel Daten hin- und wieder herschiebst kannst du die 1-3 Wochen verkürzen?

Oben schreibst du ssh funktioniert nicht, unten schon :confused:

Grüsse, Stefan

johnpatcher
16.05.04, 11:03
ich hatte bei meinem 8.1 das problem nach etwa 4 tagen. er hat sich komplett "erhängt" nur noch hardreset ging. ist mir 2x passiert. hab dann 9.0 draufgemacht und mal schaun ob da was passiert ....
ich konnte nicht rausfinden woran es lag .... ;(

johnpatcher

E S
16.05.04, 11:06
Hi,

heftiges Datenverschieben ist auf dem Server normal. Ist ein mittleres Mietshaus mit vielen Usern.

Das mit dem ifconfig werde ich das nächste mal probieren. Ist zwar keine Lösung, aber spart den reboot, wenns klappt.

Hier mal ein paar snapshoots meines Systems:

top

12:00pm up 1 day, 17:37, 1 user, load average: 0.54, 0.45, 0.39
127 processes: 125 sleeping, 2 running, 0 zombie, 0 stopped
CPU states: 0.4% user, 0.6% system, 0.0% nice, 12.9% idle
Mem: 256144K av, 252588K used, 3556K free, 0K shrd, 56836K buff
Swap: 209768K av, 23768K used, 186000K free 23152K cached

PID USER PRI NI SIZE RSS SHARE STAT %CPU %MEM TIME COMMAND
22628 root 16 0 944 944 704 R 8.9 0.3 0:00 top
1 root 15 0 96 88 64 S 0.0 0.0 0:07 init
2 root 15 0 0 0 0 SW 0.0 0.0 0:00 keventd
3 root 15 0 0 0 0 SW 0.0 0.0 0:00 kapmd
4 root 34 19 0 0 0 SWN 0.0 0.0 0:27 ksoftirqd_CPU0
5 root 15 0 0 0 0 SW 0.0 0.0 0:00 kswapd
6 root 25 0 0 0 0 SW 0.0 0.0 0:00 bdflush
7 root 15 0 0 0 0 SW 0.0 0.0 0:00 kupdated
8 root 15 0 0 0 0 SW 0.0 0.0 0:00 kinoded
10 root 25 0 0 0 0 SW 0.0 0.0 0:00 mdrecoveryd
14 root 15 0 0 0 0 SW 0.0 0.0 0:00 kreiserfsd
75 root 0 -20 0 0 0 SW< 0.0 0.0 0:00 lvm-mpd
347 root 15 0 332 320 272 R 0.0 0.1 0:02 tleds
510 root 15 0 0 0 0 SW 0.0 0.0 0:00 eth0
567 root 15 0 364 360 308 S 0.0 0.1 0:18 dhcpcd
605 root 15 0 1104 1012 872 S 0.0 0.3 0:00 smpppd
671 root 15 0 976 976 776 S 0.0 0.3 0:00 pppd


df -h

Filesystem Size Used Avail Use% Mounted on
/dev/hda2 10G 2.3G 7.7G 23% /
/dev/hda1 102M 37M 66M 36% /boot
/dev/sda1 4.1G 3.2G 894M 79% /home
/dev/hda3 46G 44G 2.3G 96% /pool
/dev/sdc2 4.1G 445M 3.7G 11% /schmitz
/dev/sdb1 2.1G 53M 2.0G 3% /www
shmfs 126M 0 126M 0% /dev/shm
Marvin:~ #


Wie man sieht, ist der mir gestern wieder abgesoffen, nach dem reboot habe ich den Thread verfasst. Wird noch eine Weile dauern, bis das wieder auftritt.


Marvin:~ # ifconfig
eth0 Link encap:Ethernet HWaddr --:--:--:--:--:--
inet addr:192.168.10.1 Bcast:192.168.10.255 Mask:255.255.255.0
inet6 addr: fe80::2e0:7dff:fe97:1444/10 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:134726 errors:0 dropped:0 overruns:0 frame:0
TX packets:202233 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:20161307 (19.2 Mb) TX bytes:199654120 (190.4 Mb)
Interrupt:11 Base address:0x9000

eth1 Link encap:Ethernet HWaddr --:--:--:--:--:--
inet6 addr: ----::---:----:----:----/--Scope:Link
UP BROADCAST NOTRAILERS RUNNING MULTICAST MTU:1500 Metric:1
RX packets:194283 errors:0 dropped:0 overruns:0 frame:685
TX packets:173553 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:190693239 (181.8 Mb) TX bytes:24228574 (23.1 Mb)
Interrupt:5 Base address:0x220

lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:0 (0.0 b) TX bytes:0 (0.0 b)

ppp0 Link encap:Point-to-Point Protocol
inet addr:---.---.---.---P-t-P:---.---.---.---Mask:255.255.255.255
UP POINTOPOINT RUNNING NOARP MULTICAST MTU:1492 Metric:1
RX packets:189262 errors:0 dropped:0 overruns:0 frame:0
TX packets:166150 errors:0 dropped:6 overruns:0 carrier:0
collisions:0 txqueuelen:3
RX bytes:186228107 (177.6 Mb) TX bytes:18885701 (18.0 Mb)

Marvin:~ #



MAC und IPs habe ich durch -- unkentlich gemacht, ich will das System ja nicht auf Hacker testen ;)

Gruß
Elmar


Man könnte meinen, dass die swap-part zu klein ist, aber auch wenn der wieder abgesoffen ist, wird die nicht benutzt. Anscheinend hat der die noch nie benutzt. naja, bei 256MB Ram...

Top bescheinigt mir ca. 97% idle, wenn der abgesoffen ist.

Wenn jemand eine Idee über irgendwelche Scripte hat, ich kann die auchu posten.