Training des BAYES Filters

Carsten Rosenberg cr at ncxs.de
Sa Feb 26 16:16:33 CET 2022


Hallo Achim,

Ich wäre bei Spam Ordnern der User immer vorsichtig ;)
Außerdem sollten es auch keine zu alten Daten sein. Bayes Statistiken 
verändern sich ja über die Zeit.

Wir arbeiten mit globalem Autolearn, schauen aber, dass wir so gut es 
geht False Positives ausschließen. Wenn Bayes anfängt Newsletter zu 
lernen, ist bald die ganze Statistik hinüber.

Ich finde auch den Fuzzy Algorithmus viel wirkungsvoller, da sich hier 
dediziert Kategorien angeben lassen. Außerdem matcht Fuzzy viel genauer.

Fuzzy läßt sich auch gut für automatisiertes Lernen von 
Userrückmeldungen verwenden, da es eine Gewichtung gibt.

Zu den Headern, wie schon in meiner anderen Mail:

https://rspamd.com/doc/configuration/statistic.html#classifier-and-headers

Viele Grüße

Carsten

On 25.02.22 17:31, Achim Lammerts via Postfixbuch-users wrote:
> Hallo Liste,
> eine generelle Frage zum manuellen Training eines BAYES Filter, hier 
> rspamd:
> Werden die Header dabei berücksichtigt oder nur der Body? Wie sieht es 
> mit umgeschriebenem Subject aus und der Auswertung, die der Dienst in 
> die Header schreibt?
> Ich habe vor, die Spamordner einfach neu scannen zu lassen. Hintergrund 
> ist der, daß ich in den letzten Wochen den Filter auf autolearn per user 
> eingestellt hatte und der BAYES in rspamd hat dann pro E-Mailadresse 
> gelernt. Das ist so nicht wirklich nützlich. Wie handhabt Ihr das?
> 
> Danke für die Hilfe & ein schönes Wochenende!
> Achim
> 


Mehr Informationen über die Mailingliste Postfixbuch-users