Gesellschaft für Informatik e.V.

Lecture Notes in Informatics


Sicherheit, Schutz und Zuverlässigkeit (SICHERHEIT 2012) P-195, 163-174 (2012).

Gesellschaft für Informatik, Bonn
2012


Copyright © Gesellschaft für Informatik, Bonn

Contents

Filtern von Spam-Nachrichten mit kontextfreien Grammatiken

Philipp Trinius and Felix C. Freiling

Abstract


Spam wird heute überwiegend mittels so genannter musterbasierte Spam- Algorithmen über Botnetze verteilt. Bei musterbasiertem Spam werden die Spam- Nachrichten erst von den Bots aus einem Muster (template) und Fülldaten zusammengesetzt. Filteransätze für musterbasierten Spam versuchten bisher, dieses Muster aus den abgefangenen Nachrichten zu extrahieren und auf reguläre Ausdrücke abzubilden. Diese Technik kann aber durch die Umsortierung von Worten oder Zeilen leicht umgangen werden. Wir schlagen einen neuartigen Filteransatz vor, der auf kontextfreien Grammatiken basiert. Unser Ansatz lernt dabei nicht die Muster sondern die ”Inhalte“ der Nachrichten. Das Resultat ist eine Grammatik, die zum Filtern von Nachrichten aus einer spezifischen Spam-Kampagne verwendet werden kann. Die Filterergebnisse dieses Ansatzes sind sehr gut: Teilweise erreichen aus einer einzelnen Nachricht erstellte Filter bereits Erkennungsraten von über 99 Prozent.


Full Text: PDF

Gesellschaft für Informatik, Bonn
ISBN 978-3-88579-289-5


Last changed 04.10.2013 18:37:30