PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Ernstes Problem mit produktivem Sendmail, bitte um Hilfe!



Qeldroma
16.02.07, 08:27
Hallo zusammen,

wir haben einen überalterten Sendmail, den wir bisher noch nicht migriert haben. Dieser bedient sowohl mehrere Firmen-Kunden als Relay, als auch einige mit lokalen Mailboxen.

Folgendes Problem:

Seit ca. zwei Wochen fallen kontinuierlich für ein bis zwei Stunden ein paar Kunden aus, indem diese uns die Verbindung verweigern.

Das bedeutet, alle Mails, die an diese Kunden gesendet werden, bekommen als Antwort "Connection reset" oder "..refused" in unseren Server-Logs zurück.

Das Merkwürdige ist, daß unser MX2 in diesen Zeiten problemlos übernimmt und ausliefert?! Somit ist ein Fehler auf der Gegenseite auszuschließen.

Da einer dieser Ausfallkunden wir selbst sind, haben wir die Möglichkeit den kompletten Weg der Emails zu loggen, jedoch ist auf dem "verweigerndem" Host kein Eintrag nach dem Motto "ich habe den MX1 geblockt" zu finden...

Was kann das nur sein?

Es verstört mich sehr, daß dies immer nur für ein/zwei Stunden auftritt und es anschließend wieder flutscht?!

Im Übrigen ist der MX1 nicht unter Last, auch nicht wenn er verweigert wird...

Bei uns und einem der betroffenen Kunden ist auch ein Spamschutz im Einsatz, weshalb ich zuerst an so etwas wie einen DOS-Schutz-Mechanismus dachte, doch leider ist unser MX1 auf beiden Systemen so freigegeben, das er die Systeme sogar flooden dürfte?!?

Habt ihr noch eine Idee??

Grüße, Florian

RichieX
16.02.07, 08:36
wir haben einen überalterten Sendmail, den wir bisher noch nicht migriert haben. Dieser bedient sowohl mehrere Firmen-Kunden als Relay, als auch einige mit lokalen Mailboxen.
Wie alt? Ein Update sollte doch möglich sein und muss eigentlich auch sein! In vorangegangen sendmail-Versionen waren eklatante Sicherheitslücken vorhanden!


Seit ca. zwei Wochen fallen kontinuierlich für ein bis zwei Stunden ein paar Kunden aus, indem diese uns die Verbindung verweigern.

Das bedeutet, alle Mails, die an diese Kunden gesendet werden, bekommen als Antwort "Connection reset" oder "..refused" in unseren Server-Logs zurück.

Das Merkwürdige ist, daß unser MX2 in diesen Zeiten problemlos übernimmt und ausliefert?! Somit ist ein Fehler auf der Gegenseite auszuschließen.

Da einer dieser Ausfallkunden wir selbst sind, haben wir die Möglichkeit den kompletten Weg der Emails zu loggen, jedoch ist auf dem "verweigerndem" Host kein Eintrag nach dem Motto "ich habe den MX1 geblockt" zu finden...

Was kann das nur sein?

Es verstört mich sehr, daß dies immer nur für ein/zwei Stunden auftritt und es anschließend wieder flutscht?!

Im Übrigen ist der MX1 nicht unter Last, auch nicht wenn er verweigert wird...

Ich hab das noch nicht so richtig verstanden. Kannst du das evtl. noch einmal etwas verständlicher, vielleicht mit zus. Logeinträgen untermauert, ausdrücken.

Evtl. gibt es Probleme mit der DNS-Auflösung :confused:

RichieX

[Edit] PS: Läuft denn die Warteschlnge voll?

Qeldroma
16.02.07, 08:50
Wie alt? 1999 ;)

SEHR alt ;)

Wir werden diesen eh dieses Jahr migrieren, nur müssen wir im Moment sofort handeln, denn der Fehler ist zu dringlich um jetzt noch eine zweiwöchige Migration zu starten...

Ich erkläre nochmal anders:
MX1 relayet kontinuierlich Mails an Kunde A(Mailserver) und an uns und einige Weitere.
Irgendwann bekommt MX1 von Kunde A oder von unserem Firmenmailserver die Antwort zurück, daß "Connection refused/reset" wurde.
Unser Mailserver queuet daraufhin für ungefähr ein bis zwei Stunden. Dann schaltet Kunde A oder wir wieder frei und wird prompt beliefert, unsere Queue wird wieder geleert.

Auf unserem eigenen Mailserver(und dem relayenden Spam-Schutz davor) ist zu diesem "Conneciton refused" nichts zu finden, was auch schon merkwürdig ist?! Ich würde eigentlich erwarten, daß diese Geräte irgendetwas vermerken, wenn Verbindungen verweigert werden?

Grüße, Florian

RichieX
16.02.07, 09:00
Dann schaltet Kunde A oder wir wieder frei
Das verstehe ich nicht so richtig. Was macht ihr da? Was bedeutet "freischalten"?

Ist dieses Verhalten regelmäßig? Jede Stunde, jeden Tag die selbe Uhrzeit ... ?

Also eigenartig ist, das beim Verbindungsversuch zum Server nichts geloggt wird. Ein "connection refused" oder wenigsten "delayed" müsste auch in der maillog stehen.


Irgendwann bekommt MX1 von Kunde A ...
Die Meldung kommt normalerweise sofort, wenn die Mail nicht ausgeliefert werden kann.

Welche sendmail-Version ist es denn nun? Und welche Distri? 1999 sagt mir nicht viel.

RichieX

Qeldroma
16.02.07, 09:38
Das verstehe ich nicht so richtig. Was macht ihr da? Was bedeutet "freischalten"?

Sorry, mein Fehler. "Freigeschaltet" ist der Eindruck der mir dabei ensteht. Ich kann auf die Sekunde genau im Log erkennen, wann eine "Verweigerung" anfängt und genauso genau wann sie aufhört.


Ist dieses Verhalten regelmäßig? Jede Stunde, jeden Tag die selbe Uhrzeit ... ?

Leider nein, sonst würde ich mich auch freuen. Es ist ungefähr ein bis zwei Stunden und er Zeitpunkt ist frei über die Tage verteilt pro Kunde ein bis drei mal.


Also eigenartig ist, das beim Verbindungsversuch zum Server nichts geloggt wird. Ein "connection refused" oder wenigsten "delayed" müsste auch in der maillog stehen.

Die Meldung kommt normalerweise sofort, wenn die Mail nicht ausgeliefert werden kann.

Ja, das sehen wir auch so. Im Moment habe ich den Sniffer auf unserer Firewall eingeschaltet um beim nächsten Mal, wenn wir verweigert werden, sehen zu können, ob die Anfrage überhaupt bis zur Firewall kommt.


Welche sendmail-Version ist es denn nun? Und welche Distri? 1999 sagt mir nicht viel.
Öhm... Wie finde ich das heraus? Beim Verbinden meldet sich dieser nicht mit seiner Version und auf Kommandozeilenebene hat "sendmail" keine Option um die Version auszuspucken?

bla!zilla
16.02.07, 09:46
Öhm... Wie finde ich das heraus? Beim Verbinden meldet sich dieser nicht mit seiner Version und auf Kommandozeilenebene hat "sendmail" keine Option um die Version auszuspucken?

Mittels dpkg oder rpm. Alternativ mittels man sendmail. Versuch mal sendmail -V oder -v.

Blade
16.02.07, 11:06
Könnte es sein, dass die Datenanbindung physikalische Probleme besitzt, z.B. durch ein Bauteil mit einem temperaturabhängigen Fehler? Ich hatte auch mal ein unsystematisches immer wiederkehrendes Verbindungsproblem und sehr lage danach gesucht, bis ein "halbdefekter" Switch ausfindig gemacht wurde. Bei richtig Last lief der Switch heiß und fiel für kurze Zeit aus.

netzmeister
16.02.07, 12:05
Hallo,

ich würde bei diesem Symptomen auch zunächst die Hardware prüfen.

Dan sieht man weiter.

Viele Grüße

Eicke

RichieX
16.02.07, 13:49
Ja, Hardware würde ich auch erstmal prüfen, wenn noch nicht geschehen. Die sendmail-Version bekommst du mit
sendmail -bs oder
sendmail -d0.1angezeigt.

RichieX

Qeldroma
16.02.07, 14:59
Eure Idee Hardware zu prüfen werde ich nachgehen.
Wir sind inzwischen so weit die Firewall vor dem Server in Verdacht zu haben, ich melde mich wieder, wenn ich was neues weiß...