zur « Themenübersicht Webmaster-Tricks
HTML_CSS - Sparte Schutz
Spamschutz mit Unicode
Eingetragen am 04.12.2006
Viele nennen mitlerweile eine eigene Website ihr eigen. Da man verpflichtet ist, auch eine Mailadresse zu veröffentlichten, beginnt bald das Übel Spam.Was passiert?
Mit einer Software werden Webseiten abgegrast und diese Bots erkennen dann im HTML-Code die Syntax des mailto-Befehls.
Auch wenn die Möglichkeit über ein Kontaktformular besteht, so steht doch zumindest die Mailadresse auf der Website.
Da die Syntax einer Mailadresse gleich ist, sind die Bots auch in der Lage, diese im Text zu erkennen.
Gott sei Dank erkennen sie aber (noch) nicht den Unicode. Dies ist für uns eine hervoragende Möglichkeit, unsere Mailadressen zu verschleiern, aber trotzdem für jeden Besucher sichtbar zu machen, bzw. die Funktionalität des mailto-Befehls zu erhalten.
Was ist der Unicode?
Dies ist ein internationaler Standard, in dem langfristig für jedes Zeichen bzw. Textelement aller bekannten Schriftkulturen und Zeichensysteme ein digitaler Code festgelegt wird.
Im Unicode finden Zeichen der wichtigsten ISO-Zeichensätze eine Entsprechung. Die meisten Webbrowser stellen die mit einer Unicode-kodierten Schrift in der Regel perfekt und vom Benutzer unbemerkt dar.
Laienhaft ausgedrückt wird jedem Zeichen eine Zahl zugeordnet. Damit der Browser das Zeichen entsprechend interpretiert, befindet sich vor der Zahl ein &# und abgeschlossen wird es mit einem ;.
So kann man zB. ein A genau so gut als als A darstellen. Den Unterschied bemerkt man erst, wenn man sich den Quelltext der Website betrachtet. Mitlerweile kann man auf dieser Art die seltesten Symbole und für uns fremde Schriften darstellen.
Genau hier setzt nun unser Hebel an:
Der Spambot liest dann micht mehr <a href="mailto... <> oder die Mailadresse DeinName@provider.de, sondern er wird mit mit wilden Symbolen und Zahlenreihen konfrontiert.
Wie komme ich nun an die Codes?
Mal bei Google nach Unicode suchen, hier findet man viele Seiten mit Tabellen zur Darstellung der Unterschiedlichsten Zeichen.
Um es euch etwas einfacher zu machen, biete ich hier einen Unicode-Generator an. Hier könnt ihr nur eure Mailadresse codieren lassen, oder aber auch komplett mit den HTML mailto-Befehl.
Zum Unicode-Generator für Mailadressen:
unicode.php
Bisherige Kommentare: Kommentar schreiben»
