PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : spams im mbox-Format gesucht -> spamassassin anlernen!



Blade
28.12.06, 19:12
Hallo zusammen,
nächste Woche werde ich in unserem Büro den alten Server mit SuSE 9.0 killen und neu aufsetzen.

Dabei werde ich auch spamassassin neu installieren, welches bisher mit der alten Bayes-Datenbank-Vers. 2.64 beste Dienste geleistet hat.

Ich werde die neue SuSE 10.1 oder 10.2 Version installieren. Kann man die Bayes-Datenbank auf die aktuelle Version 3.x konvertieren?

Wenn nicht, hat noch jemand die so nett im mbox-Format gesammelten spams der leider abgeschalteten Seite ftp://spamarchive.org ... parat, wäre echt super. Denke sogar darüber nach, die irgendwo wieder online zu stellen. Habe bisher im Internet nur ne alte mbox-Datenbank von Spams aus dem Jahr 2003 gefunden :-( ...

Besten Dank im voraus!

tschloss
28.12.06, 22:04
Meinen Spam habe ich zwar noch, der ist aber von SA entsprechend modifiziert worden (Betreff, Header-Felder, Body mit SA_Bericht). (mbox isses auch nicht, aber das ist wohl das geringste Problem; das Zeug liegt auf einem Cyrus IMAPd)

Blade
29.12.06, 13:44
Vielen Dank für die rasche Info. Wie sieht das aber mit dem Header aus, stört das spamassassin, wenn man ihm diese Spammails zum Lernen gibt? Ich weiß es nicht, ob das so gut ist. Ich habe mittlerweile angefangen den Spam-Schrott auch selbst zu sammeln,nur auch bei mir stehen diese Header-Einträge drin.

tschloss
29.12.06, 14:02
Keine Ahnung. Eigentlich müßte SA beim salearn ja versuchen, die selbst vorgenommenen Änderungen zu ignorieren.

Blade
29.12.06, 14:35
Sollte man eigentlich meinen. Habe auf der org-Seite und bei WIKI gerade mal gestöbert, aber nichts Näheres darüber finden können. Werde mal weiter nach Ausschlusskriterien suchen bzw. nach einer Ignorier-Liste ... muss es doch geben.

Blade
29.12.06, 16:38
Habe mittlerweile viel darüber gelesen, aber keine zutreffende Antwort erhalten.

Ich denke, ich werde Spamassassin mit der neuen SuSE 10.1 installieren und dann die gut funktionierende Bayes-Datenbank meines privaten Servers (SuSE 9.3) als globale Datenbank reinkopieren. Das müsste klappen, denn beide SA-Versionen sind die 3.1.x wobei sie sich nur mit der X-ten Vers.-Nr. unterscheiden.

Wenn alles scheitert, komme ich auf Dein IMAP-Angebot zurück:D . Werde berichten, wie es gelaufen ist.

Es muss klappen, ansonsten nageln mich die Client-User wegen der vielen SPAMs an den nächsten Zaunpfahl. :eek:

tschloss
29.12.06, 17:06
Klar. Cyrus speichert die Mails in einer Art Maildir Format (also jede Mail ein File) - sag Bescheid.

Blade
29.12.06, 18:24
Vielen Dank nochmals Thomas, mach ich! Wenn es nicht klappt, dann komme ich mal ein paar SPAMs schnuppern :D .

Blade
24.01.07, 11:02
So da bin ich wieder, und wollte kurz zur Lösung meiner Frage berichten.

Spamassassin wurde von mir komplett mit dem neuen Server-Betriebssystem neu aufgesetzt und die Bayes-Datenbank fein säuberlich mit eigenen zugestellten Spams und Hams aufgebaut. Pünktlich mit der 200-ten Spam und Ham schaltete sich der Bayes-Filter zu und läuft seitdem sauber.

Ich denke es ist besser den Bayes-Filter mit aktuellen Spams und eigenen Hams zu füttern, als wahllos alte Spams von vor 3 Jahren über die Datenbank zu jagen. Es kostet zwar so etwas mehr Zeit und Nerven, der Filter arbeitet dann aber auch recht treffsicher.