PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Server bricht bei Traffic einfach zusammen



Hotnine
26.01.02, 12:20
Hallo!

hatte das Problem schonmal gepostet, aber da keiner eine Lösung hatte, habe ich den Server neu aufgesetzt.
Das Problem ist, dass sobald die Traffic etwas steigt, der Server total zusammenbricht und einfriert. Er lief aber für ca einer Woche ohne irgendwelche Probleme, ich habe nichts verändert aber trotzdem friert er jetzt ein, früher passierte das nicht.
Fehler an Hardware sind ausgeschlossen.
gibt es Dateien, die eventuell mit der Traffic mitwachsen und eventuell einen Absturz verursachen könten?
Bitte helft mir ich habe alles versucht, es hat aber nichts geholfen :(

CU Till

geronet
26.01.02, 12:41
Friert er bei viel Netzverkehr ein wenn die Last pro Sekunde steigt oder wenn er eine unbestimmte Datenmenge verarbeitet hat, nach gewisser Zeit?
Eigentlich wachsen nur die Zähler bei ipchains/iptables mit.

Grüsse, Stefan

Hotnine
26.01.02, 14:43
hi!

ich würde sagen, wenn die Datenmenge größer ist, aber auch da klappts mitunter ein anderes mal nicht. 2 GB aber sind nicht zu schaffen.
achso, es ist egal ob ich up-oder downloade, er friert dann einfach ein, kann man vielleicht alles mittloggen dann den Fall rekonstruieren, und dann die Logs anschauen was als letztes geschah?
Woran könnte es noch liegen? wie gesagt am System wurde nichts verändert

CU Till

geronet
26.01.02, 15:14
Du solltest erstmal herausbekommen was das verursacht, ob's der Kernel oder ein Prozess ist..

Versuch mal mit "bing" (musste warsch. erst installieren) den Rechner mit ICMP vollzulabern, ob er dann auch friert.



Vielleicht ist ihm zu kalt? Zieh ihm doch mal ne Jacke an, dem Pingi :D

Hmm Prozessor zu warm?

Grüsse, Stefan

Hotnine
26.01.02, 18:47
hi!

also, ich schließe folgende sachen aus:
-kernel, weil ich mehrere, bei der letzten problembehandlung ausprobiert hatte, es steht auserdem auf tty10 kein kernelpanic
-hardware insgesamt, prozessor ist lauwarm

und nochmal das problem: server friert seit gestern bei höherer traffic ab, bei ständig niedriger nicht. davor liefs aber für eine woche problemlos.
wie finde ich nun aber die ursache heraus? kenne mich leider nicht so gut mit der fehlersuche aus.
mit bing, das werde ich gleich mal testen. erstmal vielen dank für deine hilfe, hast du eventuell noch mehr ideen?

CU Till

EmpIRe
27.01.02, 10:16
Das Problem habe ich auch :(

Wenn ich versuche eine 750MB große avi Datei auf meinen anderen rechner zu kopieren bleibt der Server einfach stehen. Egal ob mit FTP, Samba oder Apache...

Bei etwa 450MB mit dem Apache ist schluss...

Ich habe SuSE Linux 7.2 mit dem Kernel 2.4.4 laufen.
System ist ein Duron 850, 256MB DDR RAM, 40GB HDD

CPU ist ebenfalls lauwarm.

Hotnine
27.01.02, 13:17
hi!

mmh, ich benutze für meinen Server auch SuSE 7.2, habe aber mir nen eigenen Kernel kompilliert(2.4.17).
Lief es bei dir auch am Anfang ohne Probleme?
Hat noch einer ne Idee was wir probieren könnten?
hab mal bing benutzt, hier die Ausgabe:

--- Client statistics ---
bytes out in dup loss rtt (ms): min avg max
44 1020 913 10% 229.863 12027.193 18548.366
108 1020 189 81% 76.418 7682.048 17677.411

--- Server statistics ---
bytes out in dup loss rtt (ms): min avg max
44 1019 945 7% 76.348 12018.503 18710.650
108 1019 268 73% 153.469 8381.266 18242.337

--- estimated link characteristics ---
warning: rtt small host1 229.863ms > rtt small host2 76.348ms
warning: rtt big host1 76.418ms < rtt small host2 229.863ms

minimum delay difference is zero, can't estimate link throughput.

CU Till

geronet
27.01.02, 14:41
Ihr könnt ja mal die Netzwerkkarten austauschen, das wär das einzige was ich täte. Hatte schonmal ne kaputte Realtek.

Grüsse, Stefan

Hotnine
27.01.02, 16:41
hi!

ja, das hab ich auch schon probiert, leider ist sie ganz. Ich vermute, das es irgendwas ist, was sozusagen bei Traffic "dynamisch mitwächst" habe aber keine Ahnung, was das sein könnte, leider.
weiß ja nicht ob das von Belangen ist, aber ich habe gerade noch ein wenig gebingt :) und mir ist aufgefallen, das der Server sich bei einer Packetsize von über 48455 bytes, schwer hat zu antworten, könnte das eventuell ein Hinweis sein?
übrigens komme ich blos auf maximal 94070440bps bei einem 100 MBit Netzwerk, das sollten ja theoretisch 800000000bps sein :)
naja, vielleicht kann sich jemand darauf ja was reimen, ich leider nciht :(

CU Till

geronet
27.01.02, 17:38
Dass er sich schwer tut bei grösseren Paketen ist normal..
Interressant wäre die Ausgabe von "ifconfig" kurz vor dem Absturz, ob dort irgendwelche Overflows gemeldet werden.

Grüsse, Stefan

EmpIRe
27.01.02, 17:43
Ja nur kann man nicht vorraussagen wann ein Absturtz kommt ;)

Ich kann Traffic von über 2 GB haben und er steht noch, nur wenn eine große Datei verschickt wird, bekomme ich Probleme.

Ja, ich hatte keine Probleme @Hotnine

Netzwerkkarte habe ich auch ausgetauscht - ohne erfolg.

Buck Rogers
29.01.02, 13:35
Was mir da gerade auffällt:
Haben nicht diese VIA Chipsätze Problem bei großen Datenmengen??
Da war doch mal sowas mit VIA Chipsatz und Bug......
Kann es nicht daran liegen??

EmpIRe
30.01.02, 17:53
Stimmt da war mal was...
Der Server bei mir hat den VIA KT266&8233 auf einem Elitegroup K7VTA3.

Hab grad malk eine 648MB große Datei kopiert auf dem Server und er steht noch. Daran kanns also auch nicht liegen :(

Aber war eine gute Idee !

Hotnine
31.01.02, 18:36
hi!

hab mittlerweile mal suse 7.3 draufgezogen, keine besserung. werde am wochenende mal das motherboard wechseln.
er hat sich übrigens gerade nachdem er 100 mb(kleine dateien) übertragen hatte, an einer 20 mb großen verschluckt :(
könnte man rausbekommen ob da eventuell ein puffer überläuft? am ram liegt's nämlich nciht.
@EmpIRe: was hast du für dienste laufen?




CU Till

EmpIRe
31.01.02, 22:45
Uih das sind ne Menge:

BIND9, dhcp, Samba 2.2.0, Sendmail, Apache, MySQL, Cron, gpm, Squid, Webmin, SWAT, ProFTP, ez-ipupdate, kde2, licq

die letzten beiden entfallen ab morgen Nachmittag.

Hotnine
01.02.02, 13:18
hi!

könnte unseres problem eventuell mit einem Netzwerkdienst zusammenhängen? hatte ich mir überlegt, weil der sinn von linux ist ja eigentlich ein anderer :D
ich habe dhcpd, samba, nfs, masqu, firewall am laufen, vielleicht liegts ja z.B. am dhcpd :confused:

CU Till

EmpIRe
02.02.02, 11:46
Achja hab ich noch vergessen. Masquarding mit IPTables habe ich auch noch laufen. Ich glaube das es daran liegt. Eventuell falsch konfiguriert?!
Ich ahbe ein Startscript geschrieben das immer beim booten von dem System ausgeführt wird:


#!/bin/sh

echo ""

#DSL verbindung herstellen
#adsl-start, adsl-stop, adsl-status, adsl-setup
adsl-start

# Masquarding
iptables -t nat -A POSTROUTING -o ppp0 -j MASQUERADE
echo 1 > /proc/sys/net/ipv4/ip_forward

# ICQ Dateiempfang
iptables -t nat -A PREROUTING -p TCP --dport 5010 -i ppp0 \
-j DNAT --to 192.168.1.2:5010
iptables -t nat -A PREROUTING -p TCP --dport 5011 -i ppp0 \
-j DNAT --to 192.168.1.2:5011
iptables -t nat -A PREROUTING -p TCP --dport 5012 -i ppp0 \
-j DNAT --to 192.168.1.2:5012
iptables -t nat -A PREROUTING -p TCP --dport 5013 -i ppp0 \
-j DNAT --to 192.168.1.2:5013
iptables -t nat -A PREROUTING -p TCP --dport 5014 -i ppp0 \
-j DNAT --to 192.168.1.2:5014
iptables -t nat -A PREROUTING -p TCP --dport 5015 -i ppp0 \
-j DNAT --to 192.168.1.2:5015
iptables -t nat -A PREROUTING -p TCP --dport 5016 -i ppp0 \
-j DNAT --to 192.168.1.2:5016
iptables -t nat -A PREROUTING -p TCP --dport 5017 -i ppp0 \
-j DNAT --to 192.168.1.2:5017
iptables -t nat -A PREROUTING -p TCP --dport 5018 -i ppp0 \
-j DNAT --to 192.168.1.2:5018
iptables -t nat -A PREROUTING -p TCP --dport 5019 -i ppp0 \
-j DNAT --to 192.168.1.2:5019
iptables -t nat -A PREROUTING -p TCP --dport 5020 -i ppp0 \
-j DNAT --to 192.168.1.2:5020
iptables -t nat -A PREROUTING -p TCP --dport 5021 -i ppp0 \
-j DNAT --to 192.168.1.2:5021
iptables -t nat -A PREROUTING -p TCP --dport 5022 -i ppp0 \
-j DNAT --to 192.168.1.2:5022
iptables -t nat -A PREROUTING -p TCP --dport 5023 -i ppp0 \
-j DNAT --to 192.168.1.2:5023
iptables -t nat -A PREROUTING -p TCP --dport 5024 -i ppp0 \
-j DNAT --to 192.168.1.2:5024
iptables -t nat -A PREROUTING -p TCP --dport 5025 -i ppp0 \
-j DNAT --to 192.168.1.2:5025
iptables -t nat -A PREROUTING -p TCP --dport 5026 -i ppp0 \
-j DNAT --to 192.168.1.2:5026
iptables -t nat -A PREROUTING -p TCP --dport 5027 -i ppp0 \
-j DNAT --to 192.168.1.2:5027
iptables -t nat -A PREROUTING -p TCP --dport 5028 -i ppp0 \
-j DNAT --to 192.168.1.2:5028
iptables -t nat -A PREROUTING -p TCP --dport 5029 -i ppp0 \
-j DNAT --to 192.168.1.2:5029
iptables -t nat -A PREROUTING -p TCP --dport 5030 -i ppp0 \
-j DNAT --to 192.168.1.2:5030
# von CK222: /usr/sbin/ipmasqadm autofw -A -v -r tcp 5010 5030 -h empire.local

# Apache starten
/usr/local/apache/current/bin/apachectl start

# MySQL starten
/usr/local/mysql/current/bin/safe_mysqld &

# ProFTP starten
/etc/init.d/proftpd start

cd /usr/local/bin
./ez-ipupdate -c /usr/local/ezipupdate/dyndns.conf -R empire -N root@empire-server.de -r 3 -w
# -R (run as user) -N (wenn error email zu:) -r (retrys) -w (wildcard)

echo "ez-IP Update done"

echo "Current HDD Status:"
df
echo ""
echo "Current Online Status:"
adsl-status

Hotnine
02.02.02, 14:05
hi!

ich habs jetzt endlich geschafft, hoffe ich zumindestens. Habe zwei verschiedenen Boards getestet, bei dem einen(ASUS P5A) ist der Rechner zwar nicht eingefroren, man konnte ihn per Netz nicht mehr erreichen und ihn auch nicht herunterfahren usw.
dannach habe ich ein anderes TX Board getestet, damit läufts bis jetzt ohne Probleme.
Das Script sieht eigentlich ganz okay aus, hab ja auch Masqu am laufen und nun gehts, mal sehen wie lange :)

CU Till

EmpIRe
02.02.02, 19:02
hmm... ein MoBo zum Testen habe ich nicht. Das muss doch irgend ein Patch geben.

Kann ich einen anderen Kernel ausprobieren ohne was zu riskieren?
Weil das System sollte schon "Müllfrei" bleiben ;)

Weiß jemand wo ich SuSE Kernel herbekomme? Ich such auch schonmal weiter. Mal sheen wer zuerst was gefunden hat :)

Hotnine
02.02.02, 21:15
hi!

also mein Board war hatte kein VIA sondern einen Cyrix oder Intel Chipsatz drauf. und das hatte sowieso einen knacks im BIOS. Aber probier das auf jeden Fall mal, bei mir läufts jetzt wie gesagt.
Wegen Kernel:
bist du dir sicher, dass du den von SuSE nehmen willst? wenn ja dann lad ihn dir runter oder installiere ihn direkt, den gibts unter ftp.suse.com/pub/suse/ARCHITEKTUR/update/VERSION/kernel (ftp.suse.com/pub/suse/i386/update/7.2/kernel)
der link zeigt auf die 7.2 unter i386
wenn nicht, dann kompiliere einfach auf einer anderen linuxmaschine einen kernel, das dauert zwar ein wenig länger, ist aber viel schöner, danach kannst du nämlich immer (wenn du willst) die neueste kernelversion ohne probleme kompilieren und einspielen, das hat nicht jeder.
Bei den SuSE teilen, die sind verdammt groß und alt, also wenn du einen zweiten rechner mit linux hast, würde ich die das selbstkompilieren empfehlen.
Da kann ich dir auch gerne weiter helfen, soweit ich das kann ;)

CU Till

EmpIRe
03.02.02, 17:00
hi

wäre echt nett von dir wenn du mir dabei helfen würdest :)
Dann kompilier ich lieber selber. Oder kann es nachteile haben? weil ich brauche USB unterstützung und soweit ich weiß ist die nicht in dem "normalen" Kernel drin.

Ist schon fast egal wie lange das dauert hehe :)
PC`s sind eh fast 24h an

Hast du ICQ ?
Meine nummer: 44957709

Komet
03.02.02, 21:02
Hallo

Kleiner Hinweis wegen SuSE Kernels:
ftp://ftp.suse.com/pub/people/mantel/next
Da gibt's immer den aktuellen 2.2er und 2.4er Kernel als bz2 und rpm zum download. ( Der gwdg Mirror ist übrigens um einiges schneller:
ftp://ftp.gwdg.de/pub/linux/suse/ftp.suse.com/people/mantel/next )

Ich hatte damals auch Probleme mit meinem Router, ist nach einer Weile auch einfach eingefroren, ohne ersichtlichen Grund. System war damals SuSE 7.2 mit Kernel 2.4.4. Nach einem Kernel-update lief er dann ohne Probleme.

EmpIRe
04.02.02, 16:27
Ach was, auch der 2.4.4 ;)
Den habe ich auch auf dem Server laufen. Dann ist der wohl ein bischen buggy ;)

Welchen hast du jetzt drauf?

Komet
04.02.02, 22:10
Mein Router läuft jetzt mit dem 2.2.19er SuSE-Kernel. Der Server läuft damit seit über drei Wochen und ich hab keinerlei Probleme, auch bei hohem Traffic nicht.

EmpIRe
07.02.02, 18:11
Ok ich probiers dann mal die Tage mit einem neuen.