PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Als Spam markierte mails und sa-learn



|sirvival|
23.04.04, 23:13
Hi Zusammen

mein Spamfilter funktioniert nun wunderbar inkl. der lern Funktion.
Nun hab ich allerdings noch eine Frage.
Für nicht eindeutig als erkannte Mails wird ein Bericht generiert und die Spamnachricht als Anhang angehängt.
Nun frag ich mich, ob ich diese Berichte inkl. Ahnang einfach an sa-learn übergeben kann und sa-learn den Bericht erkennt und ausschliest oder er sich ein bisschen dran "verschluckt"

Gruß
SirVival

RipClaw
23.04.04, 23:45
Hi Zusammen

mein Spamfilter funktioniert nun wunderbar inkl. der lern Funktion.
Nun hab ich allerdings noch eine Frage.
Für nicht eindeutig als erkannte Mails wird ein Bericht generiert und die Spamnachricht als Anhang angehängt.
Nun frag ich mich, ob ich diese Berichte inkl. Ahnang einfach an sa-learn übergeben kann und sa-learn den Bericht erkennt und ausschliest oder er sich ein bisschen dran "verschluckt"

Gruß
SirVival

sa-learn entfernt automatisch den Bericht.

Man kann übrigens den auto_learn Modus aktivieren um nicht mehr jede als Spam erkannte Mail manuell übergeben zu müssen.

Bei mir in der local.cf steht z.B.

auto_learn 1
auto_learn_threshold_nonspam 0.0
auto_learn_threshold_spam 8.0

Damit wird alles über 8 Punkten automatisch an sa-learn als Spam übergeben und alles unter 0 Punkten automatisch als "nicht Spam". Die Grenze für das automatische Lernen von Spam liegt jedoch etwas ausserhalb der Grenzen die ich für die Spammarkierung gesetzt habe (5 Punkte) um zu vermeiden, daß falsch erkannte Mails automatisch gelernt werden.

|sirvival|
24.04.04, 11:49
supi
danke für den Tipp
gleich eingebaut.

Wieviel Spam Mails braucht man, bis der Filter eingermassen dicht ist?

RipClaw
24.04.04, 16:17
supi
danke für den Tipp
gleich eingebaut.

Wieviel Spam Mails braucht man, bis der Filter eingermassen dicht ist?

Man braucht schonmal 200 Mails von jeder Sorte damit der Bayesfilter überhaupt aktiv ins Geschehen eingreift.

Wenn er aktiv ist sollte er eine Erkennungsrate von ca. 90-95% haben.
Da Spammer aber immer mal wieder sich was neues einfallen lassen wird die Erkennung mal besser und mal schlechter funktionieren.