Bayes'sche Lernverfahren für den Spam-Filters einschalten

Das Spam-Filter-System unterstützt das Bayes'sche Lernverfahren. Das Bayes'sche Lernverfahren ist ein mathematisches Verfahren, durch das Rechner in gewissem Umfang lernfähig werden.
Software, die nach dem Bayes'schen Verfahren arbeitet, kann Muster erkennen, wenn sie immer wieder Nachrichten verarbeitet, von denen bekannt ist, dass es sich bei ihnen entweder um Spam oder nicht um Spam handelt. Mit der Zeit werden die Bewertungen, die anhand des Bayes'schen Lernverfahrens vergeben werden, immer treffsicherer.

MDaemon führt jede Nacht um Mitternacht das Lernprogramm SA-Learn aus. Das Programm untersucht die Inhalte je eines Ordners mit als Spam bekannten und als normalen Nachrichten bekannten Elementen. Diese Ordner und ihre Inhalte muss der Systemverwalter selbst bereit stellen. Sobald genug Nachrichten in dieser Weise ausgewertet werden (mindestens 200 für jeden Typ), beginnt der heuristische Programmkern des Spam-Filters, unter Anwendung des Bayes'schen Verfahrens, mit der Bewertung eingehende Nachrichten.
Da die Ergebnisse, die nach dem Bayes'schen Verfahren ermittelt werden, mit der Zeit immer genauer werden, erreicht das System auch eine immer höhere Treffsicherheit bei der Bewertung der Nachrichten.

Besonders wichtig: Das Lernprogramm hängt von dem Urteil des Systemverwalters ab. SA-Learn verlässt sich darauf, dass der Systemverwalter das Programm nur mit Nachrichten versorgt, die tatsächlich Spam und normale Nachrichten sind, und dass er diese Nachrichten nach den beiden Kategorien richtig einteilt. Er prüft diese Entscheidung des Systemverwalters nicht, sondern
handelt nur danach.

Um das Bayes'sche Lernverfahren zu nutzen, ist wie folgt vorzugehen: Im Menü |Spam-Filter|Bayes müssen durch die Steuerelemente Öffentliche Ordner zwei öffentliche Ordner angelegt werden, und zwar einer für falsche negative (Nachrichten, die als Spam hätten erkannt werden müssen aber nicht erkannt wurden) und einer für falsche positive (Nachrichten, die fälschlich als Spam gekennzeichnet wurden und normale, gute Mails). Diese Ordner müssen allen IMAP-Benutzern zugänglich gemacht werden (dies geschieht grundsätzlich automatisch). Der Systemverwalter muss dann die Benutzer veranlassen, Kopien aller bei ihnen eingegangenen falschen negativen und
falschen positiven Nachrichten in diese Ordner zu kopieren. MDaemon verarbeitet diese mithilfe des Lernprogramms jede Nacht um Mitternacht und löscht die Nachrichten anschließend.

Mithilfe dieser einfachen Vorgehensweise bekommt der Systemverwalter ein Werkzeug in die Hand, dass beim Kampf gegen Spam automatisch lernen kann und nach nur kurzer Zeit das System umfassend an die Erfordernisse der jeweiligen Einsatzbedingungen angepasst haben wird.



 

Add Feedback