PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Server verliert IP



pibi
25.11.14, 22:52
Hallo zusammen

Ich betreibe in meinem Keller zwei Server, die den Zugang zum Internet fuer diverse Applikationen herstellen. Beides sind nicht mehr ganz aktuelle ML370 (ein M4 und ein M5, wenn ich es recht in Erinnerung habe). Installiert ist auf beiden die openSuSI 13.1 mit den aktuellen Updates. Hardware wurde bei der Installation problemlos erkannt und installiert und konfiguriert.

enp5s0 ist die Verbindung zum Internet (Konfiguration ueber DHCP vom Provider), enp3s0 ist die Karte fuer das interne Netz (Konfiguration fest zugewiesen). Beide sind "on-board".

Server2 (der neuere der beiden, der M5) verliert leider immer wieder sporadisch (ca. alle 2-3 Wochen) die Konfiguration des Netzwerks "gegen aussen" (on-board Netzwerkkarte). Dies auessert sich dadurch, dass weder eingehender noch ausgehender Traffic moeglich ist. Ein
systemctl restart network@enp5s0.servicebehebt das Problem. Das ist sehr aegerlich. Solche Probleme hatte ich bisher in ca. 20 Jahren SuSI-Linux noch nie.

Server2:
server2:~ # lspci | grep -i ether
03:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5708 Gigabit Ethernet (rev 12)
05:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5708 Gigabit Ethernet (rev 12)
12:02.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5703 Gigabit Ethernet (rev 10)
server2:~ #Hinweis: Die 12.02.0 ist eine zusaetzliche Steckkarte, die ich "auf Vorrat" zusaetzlich eingebaut habe und die bisher noch unkonfiguriert ist.

Frage: Einen Konfigurationsfehler schliesse ich eigentlich aus. Koennte es ein Hardwaredefekt sein? Ist dies irgendwie bekannt? Der zweite Server rennt problemlos durch. Braucht Ihr weitere Infos?

Any ideas are welcome.

Gruss Pit.

muell200
26.11.14, 08:48
Any ideas are welcome.


hallo Pit,

koennte alles sein.

folgendes wurde ich testen/pruefen:
- steht was in den logs, wenn er die verbindung verliert?
- hat evt. das modem/router ein problem?
- fehlerhafte packete auf der leitung?
- netzwerkgeschwindigkeit / kabel zum modem pruefen
- energiesparmodus

zeige mal die ausgabe von ifconfig und ethtool, wenn es nicht geht

pibi
26.11.14, 10:10
koennte alles sein.So weit war ich auch schon;-)
- steht was in den logs, wenn er die verbindung verliert?Auf den ersten Blick habe ich nix verdaechtiges entdecken koennen. Ausserdem ist es recht schwierig, den exakten Zeitpunkt festzustellen. Ich merke es nur, wenn mein Proxy nicht mehr funktioniert....
- hat evt. das modem/router ein problem?Kann ich mir nicht vorstellen. Ich habe ein Kabelmodem (Cablecom), daran haengt ein kleiner Hub, an dem dann beider Server angeschlossen sind. Wenn dort ein Problem auftreten wuerde, muesste doch der zweite Server auch betroffen sein, oder?
- fehlerhafte packete auf der leitung?Siehe oben. Das muesste auch beide Server betreffen.
- netzwerkgeschwindigkeit / kabel zum modem pruefenMoechte ich auch ausschliessen, da der Ausfall durch Software "repariert" werden kann ("systemctl restart ....."). Aber ich tausche gerne mal die Kabel bzw. Ports am Hub.
- energiesparmodusWo muesste man da schauen? Wo kann man das konfigurieren? Aber ich schliesse das eigentlich auch aus, da die zweite (interne) Netzwerkkarte weiterlaeuft.
zeige mal die ausgabe von ifconfig und ethtool, wenn es nicht gehtifconfig sieht aus, wie es sein sollte. ethtool habe ich noch nicht probiert.

Danke fuer Deine Ideen und Gruss
Pit.

marce
26.11.14, 11:07
lass doch einfach mal ein Ping mitlaufen, dann kannst Du es genauer eingrenzen. Auch zwischen den Servern selbst pingen, vielleicht ergibt sich da was.

Du schreibst "Hub an Kabelmodem" - sprich vom ISP ist aber schon vorgesehen, daß da 2 IPs drauf laufen und durchgereicht werden? Ist das Setup komplett neu oder lief es vorher mit anderem OS / andere Hardware problemlos?

Ggf. könntest Du auch mal einen Speichertest machen - vielleicht gibt's da irgendwas.

Evtl. auch einfach mal die Netzwerkkarten tauschen, wenn Du noch eine weitere Onboard hast kostet das ja nicht viel Aufwand.

Blinkt hinten an der Netzwerkkarte noch was, wenn das Problem vorhanden ist?

ThorstenHirsch
26.11.14, 13:11
Besteht das Problem denn schon "immer" (seit du 13.1 installiert hast)? Oder hat es erst irgendwann mal angefangen ...vielleicht nach einem Update (innerhalb 13.1)?
Und nur um sicher zu gehen: dmesg hast du auch gecheckt, ja?

pibi
26.11.14, 13:34
Du schreibst "Hub an Kabelmodem" - sprich vom ISP ist aber schon vorgesehen, daß da 2 IPs drauf laufen und durchgereicht werden? Ist das Setup komplett neu oder lief es vorher mit anderem OS / andere Hardware problemlos?Ich habe diesen Server, der seinen Vorgaenger ersetzt hat, vor ca. einem halben Jahr gebraucht gekauft und komplett neu aufgesetzt. Und ja, zu meinem Abo gehoeren max. 2 dyn. IPs. Das laeuft seit Jahren eigentlich recht gut.
Ggf. könntest Du auch mal einen Speichertest machen - vielleicht gibt's da irgendwas.Kann ich mir zwar auch nicht vorstellen, dass durch einen Speicherfehler immer der identische Effekt auftritt, aber ich probiere es mal.
Evtl. auch einfach mal die Netzwerkkarten tauschen, wenn Du noch eine weitere Onboard hast kostet das ja nicht viel Aufwand.Bei zwei verwendeten sind onboard, die dritte ist auf einem Steckplatz nachgeruestet. Alternativ kann ich auch einfach die Zuordnung internes/externes Netz tauschen. Dann muesste der Fehler ja "mitwandern".
Blinkt hinten an der Netzwerkkarte noch was, wenn das Problem vorhanden ist?Habe ich bisher nie nachgeschaut, da ich immer aus meinem Buero den Reload ausgeloest habe. Die Kiste steht ja im Keller. Aber ich werde auch das beim naechsten Mal ueberpruefen.

Gruss Pit.

pibi
26.11.14, 13:37
Besteht das Problem denn schon "immer" (seit du 13.1 installiert hast)? Oder hat es erst irgendwann mal angefangen ...vielleicht nach einem Update (innerhalb 13.1)?Siehe oben. Vor ca. einem halben Jahr gekauft und komplett neu installiert.
Und nur um sicher zu gehen: dmesg hast du auch gecheckt, ja?Ja, natuerlich.

Gruss Pit.

pibi
04.12.14, 23:33
Langsam drehe ich im roten Bereich:-(

Nachdem immer wieder im Abstand von 2-4 Tagen der besagte Server seine externe Adresse verloren hat, habe ich die zusaetzlich eingebaute Netzwerkkarte aktiviert, konfiguriert und alles umgehaengt. Jetzt lief es ein paar Tage gut, dann stoppte ploetzlich vorhin waehrend dem Anschauen von zattoo der Stream nach einer Dauer von ca. 1 Std. Siehe da, Konfiguration "ens3" (so heisst sie jetzt) ist futsch.

Anzeigen im Fehlerfall:
server2:~ # cat /tmp/ethtool
Settings for ens3:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Half 1000baseT/Full
Supported pause frame use: No
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Half 1000baseT/Full
Advertised pause frame use: Symmetric
Advertised auto-negotiation: Yes
Link partner advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
Link partner advertised pause frame use: Symmetric
Link partner advertised auto-negotiation: Yes
Speed: 100Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
MDI-X: off
Supports Wake-on: g
Wake-on: g
Current message level: 0x000000ff (255)
drv probe link timer ifdown ifup rx_err tx_err
Link detected: yes
server2:~ # cat /tmp/ifconfig
enp3s0 Link encap:Ethernet HWaddr 00:21:5A:5C:21:8A
inet addr:192.168.10.2 Bcast:192.168.10.255 Mask:255.255.255.0
inet6 addr: fe80::221:5aff:fe5c:218a/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:6946159 errors:0 dropped:0 overruns:0 frame:0
TX packets:14481048 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:1294679361 (1234.7 Mb) TX bytes:20788781990 (19825.7 Mb)

ens3 Link encap:Ethernet HWaddr 00:11:85:84:xx:yy
inet addr:84.73.xx.yy Bcast:255.255.255.255 Mask:255.255.254.0
inet6 addr: fe80::211:85ff:fe84:25b1/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:18047858 errors:0 dropped:0 overruns:0 frame:0
TX packets:7280684 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:20563078862 (19610.4 Mb) TX bytes:1383750164 (1319.6 Mb)
Interrupt:25

lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:65536 Metric:1
RX packets:15401020 errors:0 dropped:0 overruns:0 frame:0
TX packets:15401020 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:16771006766 (15994.0 Mb) TX bytes:16771006766 (15994.0 Mb)

server2:~ #
Ein
systemctl restart network@ens3.servicehat mir wieder eine Adresse meines Providers (upc cablecom) zugeteilt. Allerdings ist dies eine komplett andere als die bisherige. Das ist ungewoehnlich, denn normalerweise bekomme ich nach einer Unterbrechung von bis zu 24h wieder meine bisherige. So geschehen beim Haupt-Server, der wegen Aenderungen an der Hausinstallation (das ganze Haus war ohne Strom) vor ein paar Tagen ca. 3h offline war.

"dmesg" zeigt nur einen Haufen Eintraege der Firewall an, "/var/log/messages" rapportiert zu dieser Zeit nix aussergewoehnliches.

Als naechstes werde ich den Hub tauschen, an dem diese beiden Server ans Cablemodem angeschlossen sind. Aber ehrlich gesagt erhoffe ich mir davon auch keine Verbesserung. Den empfohlenen Mem-Check werde ich auch durchfuehren, allerdings ebenfalls mit wenig Hoffnung auf eine Loesung.

Wie gesagt: Seit Jahren betreibe ich zwei Server im Keller. Erst mit diesem ML370G5 (und auch nicht von Anfang an) treten diese Probleme auf. Ein ML370G4 mit identischer Software (openSuSI 13.1) und ebenfalls zwei Netzwerkkarten laeuft am gleichen Hub problemlos durch.

Gruss Pit.
(ziemlich ratlos)

marce
05.12.14, 06:47
Wie gesagt: Seit Jahren betreibe ich zwei Server im Keller. Erst mit diesem ML370G5 (und auch nicht von Anfang an) treten diese Probleme auf. Ein ML370G4 mit identischer Software (openSuSI 13.1) und ebenfalls zwei Netzwerkkarten laeuft am gleichen Hub problemlos durch.
gerade das würde eigentlich auf einen Hardware-Defekt hindeuten - und für so "unbestimmbares Verhalten" sind gern genommen, in beliebiger Reihenfolge:
* Speicherdefekt
* Kühlung
* Haarrisse auf Motherboard
* defekte Prozessoren
* Spannungsversorgungsprobleme
* Dreck, Kontaktprobleme, "minimal schräg eingesetzte Steckkarten"

"Hülfe" bringt aber auch manchmal ein BIOS-Update. Dann wär's noch abstruser, aber alles schon gesehen.

Die Zickigkeit von HP-Kisten mit Fremdhardware fällt bei On-Board-Netzwerkkarten hoffentlich weg und daß es evtl. nicht spezifizierte Festplatten oder sonstige Inkonsistenzen in div. internen Firmwares hat wollen wir mal ebenfalls nicht hoffen :-) Auch schon mal gesehen. War sehr lustig. Im Nachhinein.

pibi
06.12.14, 21:59
Danke marce fuer Deine Ideen. Aber...

gerade das würde eigentlich auf einen Hardware-Defekt hindeuten - und für so "unbestimmbares Verhalten" sind gern genommen, in beliebiger Reihenfolge:Alle diese Dinge koennen "willkuerliche" Fehler erzeugen, aber nicht immer wieder reproduzierbar den identischen Fehler, insbesondere mit anderere Hardware und anderen Treibern. Das waere in meinen Augen ein fast nicht moeglicher Zufall (mal abgesehen von der schraeg eingesetzen Steckkarte, die allen anderen Netzwerkverkehr stoert).
"Hülfe" bringt aber auch manchmal ein BIOS-Update. Dann wär's noch abstruser, aber alles schon gesehen.Das waere sicherlich auch eine Option. Hier gilt: Versuch macht kluch;-) Werde ich also mal angehen, sofern ich was finde. Aber wer weiss, was da sonst wieder fuer "Verschlimmbesserungen" in Bezug auf Linux vorgenommen wurden;-)
Die Zickigkeit von HP-Kisten mit Fremdhardware fällt bei On-Board-Netzwerkkarten hoffentlich weg und daß es evtl. nicht spezifizierte Festplatten oder sonstige Inkonsistenzen in div. internen Firmwares hat wollen wir mal ebenfalls nicht hoffen :-)Da kann ich jetzt eigentlich nicht klagen, im Gegentum: CPQ-HP-Server haben sich in unserer Umgebung eigentlich immer als sehr zuverlaessig und ausgereift erwiesen. Deswegen kaufe ich ja das ausrangierte Material bzw. bewahre es bei kostenloser Ueberlassung vor der Verschrottung;-)

Gruss Pit.