Spamassassin Autolearn-Feature-Problem [Archiv] - linuxforen.de -- User helfen Usern

Archiv verlassen und diese Seite im Standarddesign anzeigen : Spamassassin Autolearn-Feature-Problem

CboyGeek

22.03.04, 12:15

Hi!

Bei mir scheint der Autolearn des Bayes-Filters noch nicht zu funktionieren.
Meine Mail-Header sehen alle so aus:

X-Spam-Flag: YES
X-Spam-Checker-Version: SpamAssassin 2.63 (2004-01-11) on server.elite.lan
X-Spam-Level: *****************
X-Spam-Status: Yes, hits=17.8 required=4.0 tests=DATE_IN_FUTURE_24_48,
HTML_60_70,HTML_IMAGE_ONLY_02,HTML_MESSAGE,INVALID _DATE_TZ_ABSURD,
LOTS_OF_CC_LINES,MIME_HTML_NO_CHARSET,MIME_HTML_ON LY,
RAZOR2_CF_RANGE_51_100,RAZOR2_CHECK,RCVD_IN_BL_SPA MCOP_NET,
RCVD_IN_DSBL,RCVD_IN_NJABL,RCVD_IN_NJABL_RELAY,RCV D_IN_SORBS,
TO_ADDRESS_EQ_REAL autolearn=no version=2.63

Schicke ich aber ne Mail manuell durch Spamassassin mit eingeschaltetem Debug, so erhalte ich:

debug: auto-learn? ham=0.5, spam=6, body-hits=0.2, head-hits=0.2
debug: auto-learn: currently using scoreset 3. recomputing score based on scoreset 1.
debug: Score set 1 chosen.
debug: auto-learn: original score: 0.2, recomputed score: 0.2
debug: Score set 3 chosen.
debug: auto-learn? yes, ham (0.2 < 0.5)
debug: Learning Ham

Irgendwie komisch oder?
Weiss da jemand weiter?

pibi

22.03.04, 17:00

Original geschrieben von CboyGeek
Bei mir scheint der Autolearn des Bayes-Filters noch nicht zu funktionieren.
Doch, doch, das ist schon OK so. "autolearn=no" besagt lediglich, dass besagte Message nicht automatisch gelernt wurde, weil sie wahrscheinlich schon bekannt ist. Ueber den Status von "autolearn" (-a) sagt das gar nix aus. Wenn Du englisch kannst, dann lies mal hier (http://wiki.apache.org/spamassassin/AutolearningNotWorking).

Gruss Pit.

CboyGeek

22.03.04, 21:33

Hm, aber bei mir ist bisher bei jeder Mail ein "autolearn=no" und das bei bereits über 500 Spam-Mails! Ausserdem müsste doch die Datei "bayes_journal" im /home/???/.spamassassin Verzeichnis anwachsen oder? Und da tut sich lediglich was, wenn ichs manuell mit "spamassassin -D < mail.file" mache...

Verwirrt mich schon etwas...

CboyGeek

22.03.04, 21:34

Und den englischsprachigen Artikel kenn ich schon. Scheint aber mein Problem nicht ganz zu betreffen... Was meinst du denn mit dem "-a" bei autolearn genau?

pibi

23.03.04, 08:03

Original geschrieben von CboyGeek
Was meinst du denn mit dem "-a" bei autolearn genau? Das kommt davon, wenn man "aus dem Kopf" schreibt und nicht explicit nachschlaegt;-) Die Option "-a" ist natuerlich "use-autowhitelist" und hat mit "autolearn" nix zu tun.

Evtl. hast Du noch zu wenig hams und spam trainiert? Bei einer Anzahl von jeweils weniger als 200 ist dieses Feature inaktiv. Sieh mal hier (http://wiki.apache.org/spamassassin/BayesNotWorking) .

Gruss Pit.

CboyGeek

23.03.04, 10:44

Ist mir bekannt. Wo seh ich denn, wieviel er schon als Ham und Spam klassifiziert hat?

CboyGeek

23.03.04, 10:51

Also ein "sa-learn --dump magic" bringt bei mir folgendes:

0.000 0 2 0 non-token data: bayes db version
0.000 0 572 0 non-token data: nspam
0.000 0 269 0 non-token data: nham
0.000 0 56686 0 non-token data: ntokens
0.000 0 1065481200 0 non-token data: oldest atime
0.000 0 1079954677 0 non-token data: newest atime
0.000 0 1079991524 0 non-token data: last journal sync atime
0.000 0 0 0 non-token data: last expiry atime
0.000 0 0 0 non-token data: last expire atime delta
0.000 0 0 0 non-token data: last expire reduction count

Dürfte also doch genug sein oder?

CboyGeek

24.03.04, 12:55

Keine Idee? Ich verzweifel langsam echt an meinem Verstand...