[Postfixbuch-users] Prüfen ob gelernte Spam-Mails berücksichtigt werden

Christian Wally c.wally at cwrm.at
Do Apr 3 11:55:25 CEST 2008


On Thu, 2008-04-03 at 11:01 +0200, Thomas Schwenski wrote:
> Christian Wally schrieb:
> >> Welcher Systemuser ist relevant?
> >>
> > spamd wird von amavis nicht verwendet.
> 
> Ging mir auch noch durch den Kopf, als ich nochmal in die amavis-Config 
> geschaut habe.
> Benutzt wird er am Ende doch aber trotzdem (durch spamc), oder?
nein
> Also Deaktivieren um Ressourcen zu sparen wäre eine schlechte Idee.
> 
> > Auch Ham Training ist wichtig damit Bayes Filter funktionieren.
> 
> Das sowieso.
> Das Problem dabei ist nur, wie man das sinnvoll bewerkstelligt.
> Momentan versuche ich die Wage zu halten und in etwa genausoviel Ham wie 
> Spam zu verfüttern, nur die Ham-Beschaffung ist mühselig.
> 

> Ist es da eigentlich sinnvoll sämtliche Nachrichten per Alwayc-BCC als 
> Ham zu füttern?
> (Eventuell eben nur die selbe Anzahl wie Spams.)
> 
> Oder hebt eine als Ham und später dann als Spam gelernte Nachricht 
> diesen Mechanismus auf?
Ich denke wenn Du das somachst müsstest Du vor dem spam learning mit
--forget die mail als Ham wieder vergessen machen. Ob das aber nach
Abholung mit tchmail noch zuverlässig funktioniert weiß ich nicht.

> Wie handhabt Ihr das?
> 
Mit zuverlässig kontrollierten Maildirs und false positives.

>  > Ob die Mails richtig trainiert wurden und auch vom user vsan verwendet
>  > werden, kannst Du mit sa-learn -dump feststellen.
>  > Z.B.:
>  > su -c 'sa-learn --dump magic' vscan.

> mail:/ # sa-learn -u vscan --dump magic
> 0.000          0          3          0  non-token data: bayes db version
> 0.000          0         39          0  non-token data: nspam
> 0.000          0          1          0  non-token data: nham

> 0.000          0      33043          0  non-token data: ntokens
> 0.000          0 1138207360          0  non-token data: oldest atime
> 0.000          0 1138942183          0  non-token data: newest atime
> 0.000          0          0          0  non-token data: last journal 
> sync atime
> 0.000          0          0          0  non-token data: last expiry atime
> 0.000          0          0          0  non-token data: last expire 
> atime delta
> 0.000          0          0          0  non-token data: last expire 
> reduction count
> 
> 
Die bayes db dieses users hat 39 spam und 1 ham Mail zum Lernen
bekommen.

Ich rufe sa-learn mit der Option --dbpath auf und gebe den Pfad zum
Homeverzeichnis von amavis (in Deinem Fall vscan) an. Alsio zum
Beispiel:
sa-learn --dbpath /var/lib/amavis/.spamassassin/ --spam ...

Aber die Zahlen an wöchentlichen Spammails die Du in Deiner original
Post erwähnst horchen sich verdächtig hoch an. Wie schon andere erwähnt
haben ist Bayes Training sicher nur das letzte finetuning von SA.

ciao
chris
-- 
Christian Wally
Risk Management
Jagdbergstrasse 278
6721 Thueringerberg
T: +43-720-737014
M: +43-699-19439834
W: http://www.cwrm.at
W: http://www.trashrazor.org




Mehr Informationen über die Mailingliste Postfixbuch-users