PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : [spamassassin] mails werden nicht richtig gerated



DirtyDoc
29.12.06, 16:20
ich habe den spamassassin 3.1.3 im einsatz und filtere auf user basis. das anlernen der filter funktioniert soweit auch (ich habe ca 1000 ham und 500 spam mails), ich habe aber das problem, dass die mails, die meinen postfix passieren nicht richtige gerated werden...

beispiel:

ich habe eine mail an user1. Im Header stehen folgende SA Infos:

...
X-Spam-Checker-Version: SpamAssassin 3.1.3-gr0 (2006-06-01) on tk
X-Spam-Level:
X-Spam-Status: No, score=-0.6 required=5.0
tests=ALL_TRUSTED,EXTRA_MPART_TYPE,
HTML_MESSAGE autolearn=disabled version=3.1.3-gr0
...

die erster vermutung bei ner score von -0.6 wäre nun, dass der SA einfach nicht trainiert ist. wenn ich diese mail allerdings händisch mit "cat email.eml | spamc -u user1" bearbeite, spuckt er mir folgende header aus:


...
X-Spam-Flag: YES
X-Spam-Checker-Version: SpamAssassin 3.1.3-gr0 (2006-06-01) on tk
X-Spam-Level: ******
X-Spam-Status: Yes, score=6.1 required=5.0 tests=ALL_TRUSTED,BAYES_99,
MISSING_HB_SEP,MISSING_SUBJECT,TO_CC_NONE autolearn=disabled
version=3.1.3-gr0
...

gleiche mail bei nem anderen user mit "cat email.eml | spamc -u user1" gibt nen anderen score, die datenbanken pro user scheinen also unabhängig voneinander zu funktionieren.

der transport in meiner master.cf, der für das filtern verantwortlich ist, ist

...
spamd unix - n n - - pipe
user=mail argv=/usr/bin/spamc -d localhost -u ${user} -f -e
/usr/bin/maildrop -d ${user} -A user:${user}
...

hab ich hier irgendwo nen denkfehler drinne? warum werden alle emails immer negativ gescored und auf der konsole geht es dann? ich steh gerade voll auf dem schlauch...

DirtyDoc
29.12.06, 16:57
mist, das wäre auch zu einfach gewesen... die gefilterten tests sahen mir komisch aus und beim genaueren hinsehen habe ich gemerkt, dass sich beim copy&paste der email ungewünschte zeilenumbrüche eingeschlichen haben... :( die ratings direkt beim ausliefern stimmen also, bleibt immernoch die frage, warum es immer negativ bleibt...

Blade
29.12.06, 17:46
So ganz habe ich Dein Thread nicht kappiert, was nun noch das restliche Problem ist. Ein SCORE unter Null, also -0,6 deutet auf eine gute HAM-Mail hin. Ist sie denn aber tatsächlich eine SPAM-Mail?

DirtyDoc
29.12.06, 18:50
jo, sie ist definitiv eine spam mail. aber der erste teil des posts kann getrost ignoriert werden, das ganze beruhte auf einem fehler meinerseits...

mein problem ist, dass ich nicht verstehe, warum meine ham und spam nachrichten annähernd die gleichen scores bekommen (immer so ca. -0.7 bis -0.5). ein "sa-learn --dump all" zeigt für jeden der user allerhand zeug an, das training muss also irgendwas bewirkt haben. gefiltert wird aber im endeffekt nur so ungefährt jede zehnte mail...

liegt der fehler vllt in der master.cf und der spamc findet einfach die bayes db des angegebenen users nicht? ich wüsste halt nicht, wie ich das anders angeben soll, als mit -u...

im zweifeslfall muss ich mir mal mehr spam besorgen zum trainieren. man findet ja hinweise, dass das ganze erst mit mehreren tausend mails gut funktionieren soll...

Blade
29.12.06, 19:31
Nenene, damit spamassassin ordnugsgemäß zu arbeiten beginnt benötigst Du nur 200 SPAMs und 200 HAMs. Klar wird er erst sicher, je mehr HAMs und auch SPAMs er bekommt.

Hast Du die autolearn-Funktion von Anfang an aktiviert gehabt?
Läuft bei Dir die auto_white_list?

Ich hatte die autoleran-Funktion zunächst am Anfang sehr restriktiv eingestellt ... ham-score unter Null!

Teste doch mal, sende eine Spam an den User xyz, was passiert mit der whitelist und bayes-db des Users xyz im /home-Verzeichnis. Wurde sie verändert ... Datum + Größe?

DirtyDoc
29.12.06, 19:47
ich hab die autolearn-funktion im moment komplett deaktiviert, ich lasse jede nacht sa-learn über die einzelnen verzeichnisse laufen. aber ist eigentlich ne idee das ganze zu aktivieren um das so zu testen... danke dir

Blade
29.12.06, 19:58
Okay, dieser Tipp kommt aus Erfahrung: Als ich die Autolearn-Funktion bei neu installiertem Bayes-Filter aktiviert hatte, schlüpften zu viele SPAMs mit SCORE -0,5 durch, deshalb setzte ich in der Anfangszeit den ham-SCORE runter auf -3,2!!! Nach längerer Laufzeit kannst Du den ham-Score dann wieder auf den Standartwert 0,1 hoch setzen.

DirtyDoc
05.01.07, 16:19
ok, das aktivieren des autolearnings hat mir jetzt definitiv bewiesen, dass der zugriff per user soweit richtig funktioniert ist... nachdem das system jetzt einige tage läuft und immer mehr spam zusammenkommt, werden auch die ergebnisse besser. ich werd mich wohl einfach mal damit beschäftigen, wie man spamassassin noch ein bisschen tweaken kann...

ich hab im moment das spamlevel auf dem standardwert 5.0, wie meinst du das mit dem HAM-Score? gibts da noch einen zweiten Schwellwert, der in dem zusammenhang interessant ist?

Blade
05.01.07, 21:02
Der HAM-Score ist für die autolearn-Funktion wichtig, sonst nicht. Er definiert ab wann eine Mail als HAM-Mail eingestuft wird. Jeh mehr und besser die BAYES-Datenbank trainiert wird, sind auch die Filter-Ergebnisse.