[ext] rspamd Bayes-Training

Stefan G. Weichinger lists at xunil.at
Mi Okt 5 12:01:22 CEST 2022


Am 05.10.22 um 09:45 schrieb Ralf Hildebrandt via Postfixbuch-users:
>> languages_enabled = true;
>> per_language = true;
> 
> Die beiden hatte ich nicht, finde das aber gerade hier in der Charite
> sinnvoll, weil viele viele Sprachen im Einsatz sind. Danke für den Tip!

Sehr gerne.

>> per_user = true;
> 
> Frage dazu: Wie funktioniert das? Woran wird der User "festgemacht"
> und vor allem -- wie wird er beim Learning spezifiziert?

Siehe mein anderes Mail. Bzw nochmals hier:

rspamc learn_ham --user lists at xunil.at .Archives.2022

>> expire = -1;
> 
> Ist das sinnvoll? Ich interpretiere das als: "Alter Kram wird nie
> vergessen"...

Gerne zu hinterfragen, hab ich wohl aus irgendeinem HOWTO übernommen.

>> statfile {
>>      symbol = "BAYES_HAM";
>>      spam = false;
>> }
>> statfile {
>>      symbol = "BAYES_SPAM";
>>      spam = true;
>> }
> 
> Sind das nicht egh defaults?

Möglich. Prüfe ich noch.

>> Dennoch habe ich den negativen Eindruck, dass die Lernerei nicht fruchtet.
>> Diverses Zeugs zu Potenzmitteln und anderen Medikamenten landet in letzter
>> Zeit nach wie vor in meinem Posteingang, trotz konsequentem Trainieren
>> (durch Verschieben nach "Spam").
> 
> Was sagt denn der Score am Symbol?

Aktuell fahre ich mit "per_user = false;"

Trainiert wurde wohl genug:

Statfile: BAYES_SPAM type: redis; length: 0; free blocks: 0; total 
blocks: 0; free: 0.00%; learned: 4921; users: 1; languages: 0

Statfile: BAYES_HAM type: redis; length: 0; free blocks: 0; total 
blocks: 0; free: 0.00%; learned: 10042; users: 1; languages: 0

Spam ist seit der Änderung gefühlt weniger geworden, allerdings sehe ich 
die 2 Symbols NICHT in der Auswertung im rspamd-WebGUI (wenn ich eine 
empfangene Mail näher ansehe).

-

Generell vermute ich:

mit "per_user = true;" müßte wohl das sieve-script erweitert werden, 
damit rspamc mit der Option "--user $mailadress" aufgerufen wird.

Dann werden wohl pro Adresse/User Strings in REDIS abgelegt, und in 
Folge kann das Bayes-Module individuellere Entscheidungen treffen.

Wäre eigentlich cool.



Mehr Informationen über die Mailingliste Postfixbuch-users