Aktive E-Mail-Benutzer kennen das leidige Problem: In der Mailbox landen nicht nur willkommene Botschaften, sondern auch unerwünschte, oft genug dubiose und lästige E-Mails. Für solche wahllos gesendeten Massen-Mails hat sich die Bezeichnung "Spam" eingebürgert. Einen vollständigen Schutz vor diesen unliebsamen Botschaften gibt es nicht, wohl aber wirksame Maßnahmen zur Eindämmung.
Seit November 2001 können E-Mail-Benutzer der TU Chemnitz zum Schutz vor Spam einige Schutzmaßnahmen einstellen, die in der Ausgabe 4/2001 vorgestellt wurden (zum Nachlesen siehe http://archiv.tu-chemnitz.de/pub/2001/0101/data/mailfilter2.html). Insbesondere durch "Spamschutz RBL" werden täglich bis zu 4000 Mails abgewehrt. Allerdings müssen bei dieser Schutzmaßnahme die sendenden Rechner bereits einmal negativ aufgefallen sein, damit sie geblockt werden können. Auf der anderen Seite ist es auch möglich, dass damit alle E-Mails von bestimmten Internet-Providern abgewiesen werden, auch wenn nur einzelne Benutzer Spam-Mails versendet haben.
Wir erweitern nun die Schutzmaßnahmen um eine
Möglichkeit, die wir Spamschutz "Textanalyse"
genannt haben.
Hierbei wird jede E-Mail durch ein regelbasiertes
Erkennungssystem auf der Basis von SpamAssassin
(ein kostenfreies OpenSource-Produkt) bewertet.
Aus dem Inhalt der Mail wird eine "Spam-Wahrscheinlichkeit" (Spam score)
berechnet und in einer zusätzlichen Header-Zeile X-Spam-Score:
vermerkt.
From: New-Offers.net <new-offers@new-offers.net> To: friend@public.net Subject: Attract The Opposite Sex Instantly! *Details Inside* X-Spam-Score: 10.3 (++++++++++) ... |
Die Bewertung der E-Mail durch SpamAssassin mit dieser
"Spam-Wahrscheinlichkeit" funktioniert erstaunlich gut,
da Spam-Mails i.a. bestimmte charakteristische
Eigenschaften aufweisen: Dubiose Absende-Adresse,
falsches Datum, nur Großbuchstaben in der Betreff-Zeile, diverse Sperrwörter
usw.
Je mehr solcher Eigenschaften in einer E-Mail gefunden werden, desto
höher ist die Wahrscheinlichkeit, dass die Mail wirklich als Spam
eingestuft werden kann.
Der X-Spam-Score-Wert von 7 hat sich als ein taugliches
Limit erwiesen - Mails mit höherem Wert sind praktisch immer Spam.
Mails mit Werten zwischen 7 und 5 sind häufig auch Spam, können aber
auch "gute" Nachrichten sein.
Die Skala der X-Spam-Score-Werte ist übrigens nach oben
offen (so gibt es auch "totsichere" Spam-Mails mit Werten über 50).
Auch negative Werte sind möglich, weil auch Eigenschaften berücksichtigt
werden, die auf "gute" Mails hindeuten und damit die
Spam-Wahrscheinlichkeit senken.
Diese Textanalyse führen wir auf den Mail-Relays für alle Mails durch, die die TU von außerhalb erreichen. Aus Effizienzgründen werden allerdings nur E-Mails bis zu einer Größe von 100 kByte bewertet.
Aktivieren Sie diesen Schutz, werden für Sie Mails mit der
"Spam-Wahrscheinlichkeit" > 7 geblockt.
Wer diesen Schutz nicht einschaltet, bekommt weiterhin alle Mails.
Anhand des Headers X-Spam-Score kann dann individuell am
Mailbox-Server oder im Mailprogramm gefiltert werden
(Hinweise unter
http://www.tu-chemnitz.de/urz/mail/cyrus/sieve.html).
| Frank Richter, November 2002 |