PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Server "friert ein"



Windoofsklicker
09.04.03, 21:18
Hi Forum.

Mein RedHat 8 Server friert ab und an ein. Er ist dann nicht mehr über Samba zu erreichen, der SSH Zugang geht nur noch sehr sehr schleppend oder garnicht mehr.
Ab und an funktioniert das Routing zwischen ppp0 und eth0 noch, manchmal nicht.

Nachdem ich erst dachte, ein böser Strolch treibt hier sein Unwesen, habe ich mittlerweile den SMBD und NMBD in Verdacht, denn jedes Mal, wenn der Server "einfriert" empfängt mein Arbeitsrechner keine SMB Messages mehr.

Zu den Logfiles:

im log.nmbd steht regelmässig:

<=== schnipp ===>

[2003/04/09 19:35:33, 0] nmbd/nmbd_packets.c:retransmit_or_expire_response_recor ds(1655)
retransmit_or_expire_response_records: Failed to resend packet id 22366 to IP 192.168.0.255 on subnet 192.168.0.1

<=== schnipp ===>

im log.smbd

<=== schnipp ===>

[2003/04/05 11:13:27, 0] lib/util_sock.c:read_data(436)
read_data: read failure for 4. Error = Connection timed out

<=== schnipp ===>

Was auch merkwürdig ist, ich hatte nie Einträge in der lmhosts und konnte SMB Messages versenden. Nachdem mein Rechner sich heute mal wieder erhängt hat, konnte ich keine SMB Nachrichten versenden.

Angeblich konnte er den Hostname nicht auflösen:

added interface ip=192.168.0.1 bcast=192.168.0.255 nmask=255.255.255.0
Cannot resolve name <Rechnername>#0x3
Das deutet ja darauf hin, dass der NMBD nicht sauber läuft.

Trage ich den Rechner in die lmhosts ein, dann kommt folgendes:

added interface ip=192.168.0.1 bcast=192.168.0.255 nmask=255.255.255.0
session request failed

Wenn ich smbclient -L <rechnername> eingebe, wird brav alles an Diensten auf dem Zielrechner aufgelistet.

Das wirklich Merkwürdige ist, dass ich an der Konfiguration nichts verändert habe und es von einen auf den anderen Tag nicht mehr funktioniert.

Hat jemand eine Idee, wo man da noch suchen könnte?

<edit> Toll, nachdem ich jetzt mal zwischen dem Rechner meiner Freundin (WIn98) und meinem Rechner (WinXP Home) jeweils eine Nachricht verschickt habe, funktioniert es. Wie soll man da einen Fehler suchen/ finden!?? :mad: </edit>

reno
10.04.03, 08:21
Ja griaß Di,
vielleicht ist das ja ein Windows-Problem. :cool:

Windoofsklicker
10.04.03, 08:54
davon sollte der linux server aber nicht abstürzen, gell?

mamue
10.04.03, 09:19
Verbraucht der smbd alle Prozessorzeit?
Schau mal top an der Konsole nach, was da läuft. Wenn ich Dich richtig verstanden habe, ist der Rechner nicht völlig tot.

mamue

Windoofsklicker
10.04.03, 11:06
ich konnte bisher nur ein mal noch auf das system, als es sich in diesem zustand befand. da war die prozessliste voll mit smb instanzen.
daher kam ja auch mein verdacht.

Doh!
10.04.03, 20:46
Samba bringt Linux eigentlich nicht zum Absturz. Ich tippe eher auf ein Netzwerkproblem: Entweder Karte am Popo, Kabel net ok oder Sitch/Hub verhaspelt sich (falls Du einen hast).

Darauf deutet vor allen Dingen hin, dass er versucht, Pakete neu zu versenden (weil welche verloren gegangen sind).

Prüf mal Duplex-Modus und Speed Deiner Karten, die sollten übereinstimmen, sonst gibt's Ärger. Hast Du Deinen Server direkt in ein DSL-Modem eingepöppelt? Die meisten DSL Modems können nur 10MBit/s. Wenn auf Deiner Netzwerkkarte nu 100 MBit eingestellt ist, gibt's Ärger.

Benutzt Du ein Crossoverkabel? Falls ja --> Selbstgebastelt? Falls ja ---> geh in Laden und kauf Dir ein ordentliches.

Windoofsklicker
10.04.03, 20:55
hm...aaalso:

die netzwerkkarte an der das dsl modem hängt ist eine 10 mbit karte.
die kabel sind alle konfektionsware. keins selber gebaut oder ähnliches.
das problem tritt schon über einen längeren zeitraum auf. in diesem wurde auch ein alter 10 mbit hub gegen einen 100 mbit switch ausgetauscht. in diesem zuge wurde auch im linux server eine netzwerkkarte ausgetauscht (10 => 100 mbit)

mamue
10.04.03, 21:00
Ich habe es schon gelegentlich erlebt, dass smbd prozesse 100% der CPU-Zeit verbraucht haben. Gerüchteweise kann es Probleme geben, wenn die *.tdb auf einer reiserFS Partition liegen. Meine liegen auf einer XFS-Partition, beiden gemeinsam ist das journaling.
Wie sieht es bei Dir aus?

mamue

Windoofsklicker
10.04.03, 21:06
alle systempartitionen ext3/ swap und eine datenplatte mit ext2

Doh!
10.04.03, 21:12
Das ist ganz sicher ein Hardware-Netzwerkproblem (bzw Treiber). Wenn wat langsam wird und er solche Fehlermeldungen bringt, dann stimmt was mit dem Netzwerk nicht. Hatten wir in der Firma auch. Überprüf mal Deinen Switch. Kann man über ne Konsole ran? Was haste für einen?

Windoofsklicker
10.04.03, 21:19
http://www.boardbroker.de/article.php?artid=178

den switch habe ich... nur trat das problem bereits mit einem 10 mbit hub auf, den ich davor im einsatz hatte.

die erscheinung ist auch in keiner weise reproduzierbar. sie kündigt sich halt nur dadurch an, dass keine pop ups mehr kommen...

Doh!
10.04.03, 21:54
kannste Dir für ne Zeit mal einen hochwertigeren Switch oder Hub (Netgear oder gar HP, Cisco) leihen und es dann mal ne weile probieren. Der, den Du da hast ist ja schon recht billig...

gib mal

ifconfig -a

ein und poste was dabei rauskommt

Windoofsklicker
11.04.03, 08:38
eth0 Link encap:Ethernet HWaddr <MAC>
inet addr:192.168.1.1 Bcast:192.168.1.255 Mask:255.255.255.0
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:329 errors:0 dropped:0 overruns:0 frame:0
TX packets:305 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:51735 (50.5 Kb) TX bytes:101097 (98.7 Kb)
Interrupt:10 Base address:0xdc00

eth1 Link encap:Ethernet HWaddr <MAC>
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4356 errors:0 dropped:0 overruns:0 frame:0
TX packets:4349 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:100
RX bytes:372721 (363.9 Kb) TX bytes:306236 (299.0 Kb)
Interrupt:9 Base address:0xdf00

lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:97 errors:0 dropped:0 overruns:0 frame:0
TX packets:97 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:11367 (11.1 Kb) TX bytes:11367 (11.1 Kb)

ppp0 Link encap:Point-to-Point Protocol
inet addr:<IP> P-t-P:<IP> Mask:255.255.255.255
UP POINTOPOINT RUNNING NOARP MULTICAST MTU:1492 Metric:1
RX packets:4334 errors:0 dropped:0 overruns:0 frame:0
TX packets:4328 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:3
RX bytes:275991 (269.5 Kb) TX bytes:209700 (204.7 Kb)


da ich ebend erst hochgefahren habe schau ich mal nach einer längeren uptime nach.

artspin
11.04.03, 09:15
Was steckt denn für eine Grafikkarte in dem Server NVidia oder ATI?
Wir hatten mal das gleiche Problem und es hat sich herrausgestellt, dass der nvidia-treiber ständig eingefroren ist. Nachdem ich eine einfache ATI-Karte (8MB) eingebaut habe, hat die Maschine keine Probleme mehr gemacht.
Ist vielleicht ein Ansatz...

Ciao
-=< artSpin >=-

mamue
11.04.03, 10:16
Hast Du schon auf der Konsole nachgeschaut, welche prozesse laufen (top)?

mamue

Windoofsklicker
11.04.03, 13:44
die prozessliste konnte ich meistens nicht mehr erreichen.
graka war eine diamond stealth III 540 und ist jetzt eine elsa mit 4 mb oder so.

Doh!
11.04.03, 15:45
Versuch mal bei Samba folgendes im global-Bereich:

interfaces = [IP des Interfaces, über das Samba angesprochen werden soll]
bind interfaces only = yes

Windoofsklicker
11.04.03, 16:51
..das steht da schon drin :)

[global]
workgroup = <wg name>
netbios name = nb name
server string = rabarerabarbara
local master = yes
security = user
encrypt passwords = yes
interfaces = 192.168.0.0/24
bind interfaces only = yes
guest account = nobody
map to guest = bad user

Windoofsklicker
03.05.03, 19:30
Der Kandidat mit dem Tipp des HW Problems bekommt 100 Punkte.
Der Promise FastTrak100 stirbt ab. Mittlerweile erkennt er beim booten zeitweise keine Festplatten mehr.

Tja und meine 80 Gig IBM Platte hat ebenfalls aussetzer :(

Jetzt muss das Ding anbleiben, biss ich die Ersatzteile habe... :mad: