XXLRay
01.09.09, 12:58
Ich betreue einen Mailserver mit sendmail, Amavis und Spamassassin. Die Erkennungsrate des bayesischen Filters liegt schon seit Monaten unter 10% obwohl er täglich mit über 1.000 (Tausend) Mails manuell trainiert wird und autolearn aktiviert ist.
Jetzt ist mir aufgefallen, dass im X-Spam-Status-Header der emails keine Information zum Autolearn steht. Normalerweise sollte dort aber so etwas stehen wie autolearn=spam, autolearn=ham oder autolearn=no.
Meine /etc/mail/spamassassin/local.cf:
# Limit from that on mail is treated as Spam
required_hits 5
# When using _REQD_ and _SCORE_ tags set report_safe to 0 -> only X-Spam-header is modified
report_safe 0
# Add Information to header (not done on report_safe 0)
rewrite_header Subject [SPAM]
# Activate bayesian filter
use_bayes 1
# Learn from own detected mails if 1 !!! May also learn false negatives !!!
bayes_auto_learn 1
# Set limit for auto learned Ham
bayes_auto_learn_threshhold_nospam 0.0
# Set limit for auto learned Spam
bayes_auto_learn_threshold_spam 9.0
# Set which networks or hosts are considered 'trusted' by your mail
# server (i.e. not spammers)
# trusted_networks 212.17.35.
# Turn of bayesian filtering separate from learning
# use_bayes_rules 0
Der X-Spam-Status-Header einer repräsentativen Spam Email sieht so aus:
Yes, score=15.684 required=5 tests=[BAYES_50=0.001, DATE_IN_FUTURE_12_24=2.189, DNS_FROM_RFC_BOGUSMX=1.482, RATWARE_RCVD_PF=3.847, RCVD_ILLEGAL_IP=1.908, RCVD_IN_PBL=0.905, RCVD_IN_XBL=3.033, RDNS_NONE=0.1, TVD_SPACE_RATIO=2.219]
Ham Email:
No, score=-3.3 required=5 tests=[ALL_TRUSTED=-1.8, BAYES_00=-1.5]
Unsichere Email:
Yes, score=6.785 required=5 tests=[BAYES_00=-1.5, DCC_CHECK=2.17, HTML_MESSAGE=0.001, MIME_HTML_ONLY=1.457, RCVD_IN_PBL=0.905, RCVD_IN_SORBS_WEB=0.619, RCVD_IN_XBL=3.033, RDNS_NONE=0.1]
1) Ich würde bei der Spam-Mail jetzt die Information autolearn=spam erwarten, da der score mit 15.684 über dem bayes_auto_learn_threshold_spam von 9.0 liegt. Bei der Ham Mail würde ich autolearn=ham erwarten, weil der score mit -3,3 unter dem bayes_auto_learn_threshhold_nospam von 0.0 liegt. Bei der unsicheren Mail würde ich autolearn=no erwarten, weil der score mit 6,785 genau zwischen den beiden Thresholdwerten liegt. Liege ich da falsch?
2) Gibt es eine Option, die verhindert, dass die Autolearninformationen in den Header geschrieben werden? Taucht dort vielleicht deswegen ncihts auf?
3) Ich habe den Server von meinem Vorgänger übernommen, der (wie so oft) nicht mehr zu erreichen ist. Könnte es sein, dass evtl eine ganz andere Datei zur Konfiguration verwendet wird? Wie finde ich raus, welche Spamassassinkonfig aktiv ist?
Jetzt ist mir aufgefallen, dass im X-Spam-Status-Header der emails keine Information zum Autolearn steht. Normalerweise sollte dort aber so etwas stehen wie autolearn=spam, autolearn=ham oder autolearn=no.
Meine /etc/mail/spamassassin/local.cf:
# Limit from that on mail is treated as Spam
required_hits 5
# When using _REQD_ and _SCORE_ tags set report_safe to 0 -> only X-Spam-header is modified
report_safe 0
# Add Information to header (not done on report_safe 0)
rewrite_header Subject [SPAM]
# Activate bayesian filter
use_bayes 1
# Learn from own detected mails if 1 !!! May also learn false negatives !!!
bayes_auto_learn 1
# Set limit for auto learned Ham
bayes_auto_learn_threshhold_nospam 0.0
# Set limit for auto learned Spam
bayes_auto_learn_threshold_spam 9.0
# Set which networks or hosts are considered 'trusted' by your mail
# server (i.e. not spammers)
# trusted_networks 212.17.35.
# Turn of bayesian filtering separate from learning
# use_bayes_rules 0
Der X-Spam-Status-Header einer repräsentativen Spam Email sieht so aus:
Yes, score=15.684 required=5 tests=[BAYES_50=0.001, DATE_IN_FUTURE_12_24=2.189, DNS_FROM_RFC_BOGUSMX=1.482, RATWARE_RCVD_PF=3.847, RCVD_ILLEGAL_IP=1.908, RCVD_IN_PBL=0.905, RCVD_IN_XBL=3.033, RDNS_NONE=0.1, TVD_SPACE_RATIO=2.219]
Ham Email:
No, score=-3.3 required=5 tests=[ALL_TRUSTED=-1.8, BAYES_00=-1.5]
Unsichere Email:
Yes, score=6.785 required=5 tests=[BAYES_00=-1.5, DCC_CHECK=2.17, HTML_MESSAGE=0.001, MIME_HTML_ONLY=1.457, RCVD_IN_PBL=0.905, RCVD_IN_SORBS_WEB=0.619, RCVD_IN_XBL=3.033, RDNS_NONE=0.1]
1) Ich würde bei der Spam-Mail jetzt die Information autolearn=spam erwarten, da der score mit 15.684 über dem bayes_auto_learn_threshold_spam von 9.0 liegt. Bei der Ham Mail würde ich autolearn=ham erwarten, weil der score mit -3,3 unter dem bayes_auto_learn_threshhold_nospam von 0.0 liegt. Bei der unsicheren Mail würde ich autolearn=no erwarten, weil der score mit 6,785 genau zwischen den beiden Thresholdwerten liegt. Liege ich da falsch?
2) Gibt es eine Option, die verhindert, dass die Autolearninformationen in den Header geschrieben werden? Taucht dort vielleicht deswegen ncihts auf?
3) Ich habe den Server von meinem Vorgänger übernommen, der (wie so oft) nicht mehr zu erreichen ist. Könnte es sein, dass evtl eine ganz andere Datei zur Konfiguration verwendet wird? Wie finde ich raus, welche Spamassassinkonfig aktiv ist?