zur « Themenübersicht Dit&Dat

Diverses - Sparte

Eingetragen / aktualisiert am 04.12.2006

Viele nennen mitlerweile eine eigene Website ihr eigen. Da man verpflichtet ist, auch eine Mailadresse zu veröffentlichten, beginnt bald das Übel Spam.

Was passiert?
Mit einer Software werden Webseiten abgegrast und diese Bots erkennen dann im HTML-Code die Syntax des mailto-Befehls.
Auch wenn die Möglichkeit über ein Kontaktformular besteht, so steht doch zumindest die Mailadresse auf der Website.
Da die Syntax einer Mailadresse gleich ist, sind die Bots auch in der Lage, diese im Text zu erkennen.

Gott sei Dank erkennen sie aber (noch) nicht den Unicode. Dies ist für uns eine hervoragende Möglichkeit, unsere Mailadressen zu verschleiern, aber trotzdem für jeden Besucher sichtbar zu machen, bzw. die Funktionalität des mailto-Befehls zu erhalten.

Was ist der Unicode?
Dies ist ein internationaler Standard, in dem langfristig für jedes Zeichen bzw. Textelement aller bekannten Schriftkulturen und Zeichensysteme ein digitaler Code festgelegt wird.
Im Unicode finden Zeichen der wichtigsten ISO-Zeichensätze eine Entsprechung. Die meisten Webbrowser stellen die mit einer Unicode-kodierten Schrift in der Regel perfekt und vom Benutzer unbemerkt dar.
Laienhaft ausgedrückt wird jedem Zeichen eine Zahl zugeordnet. Damit der Browser das Zeichen entsprechend interpretiert, befindet sich vor der Zahl ein &# und abgeschlossen wird es mit einem ;.
So kann man zB. ein A genau so gut als als A darstellen. Den Unterschied bemerkt man erst, wenn man sich den Quelltext der Website betrachtet. Mitlerweile kann man auf dieser Art die seltesten Symbole und für uns fremde Schriften darstellen.

Genau hier setzt nun unser Hebel an:
Der Spambot liest dann micht mehr unicode.php

 

Spamschutz mit Unicode