rspamc learn_spam bei vielen Accounts

Beat Jucker beat at juckers.ch
So Mär 14 16:14:07 CET 2021


Hallo Andreas

In rspamc verarbeitest du die gleichen 400'000 Mails immer und immer 
wieder.
Eine Optimierung mit einem Timestamp wäre sicher eine einfache Verbesserung:

# create an old timestamp if not already in use
TIMESTAMP=/tmp/rspamc_learn.timestamp
[ -r $TIMESTAMP ] || touch -t 200001010001 $TIMESTAMP

# process all newer mails compared to timestamp
find ... -newer $TIMESTAMP ...
find ... -newer $TIMESTAMP ...
find ... -newer $TIMESTAMP ...

# update timestamp
touch $TIMESTAMP

Gruss
-- Beat



Am 14.03.2021 um 12:19 schrieb Andreas:
> Hallo zusammen,
>
> ich habe hier einen Postfix-/Dovecot-Server mit 105 Accounts und ca. insgesamt
> 400.000 Mails.
> Jetzt sollte Rspamd täglich Spam und Ham lernen, dazu habe ich folgendes
> Script unterhalb von /etc/cron.daily liegen:
>
> #!/bin/bash
>
> find /var/vmail/*/*/.Junk/cur/ -type f -exec /usr/bin/rspamc learn_spam {} \;
>
> find  /var/vmail/*/*/cur -type f -exec /usr/bin/rspamc learn_ham {} \;
> find /var/vmail/*/*/.Sent/cur -type f -exec /usr/bin/rspamc learn_ham {} \;
>
> Das dauert nur viel zu lange. Gibt es bei solchen Accountgrößen und Mailmengen
> eine bessere Methode den Lernprozess durch zu führen?
>
> Beste Grüße
>
> Andreas´
>
>
>
>



Mehr Informationen über die Mailingliste Postfixbuch-users