zur « Themenübersicht Webmaster-Tricks
HTML_CSS - Sparte Google-Adds
Google-Index
Eingetragen am 31.08.2007
Ihr aktualisiert eure Homepage, löscht vielleicht eine Seite...
Google ist mit dem Aktualisieren seines Indexes manchmal recht langsam und es kann vorkommen, dass eure Seite noch wochenlang im Google-Index auftaucht.
Ärgerlich für die Besucher, die dann eine error404-Fehlerseite erhalten und der Besucher für euch meistens verloren ist.
Dannn stellt euch mal folgendes Szenario vor, was übrigens nicht gar so selten vor kommt, davon liest man dann meisten erst in den Urteilsbegründungen ;-)
Ihr verfasst eine Seite, die vielleicht rechtlich nicht ganz koscher ist, oder verstoßt aus versehen gegen geltendes Recht.
Google findet bekanntlich alles, natürlich auch euren Erguss. Wenn es denn nicht schon vielleicht zu Rechtsmitteln gekommen ist, könnte es ja auch sein, dass Ihr selber erkennt, dass die Seite vom Netz sollte.
Nun speichert Google wirklich alles und hinterlegt brav alles in seinen Google-Cache. Bis Google seinen Index wieder aktualisiert kann es dauern und ob die bestimmte Seite auch raus fliegt, steht in den Sternen.
So ist außerdem über dem Google-Cache der Inhalt noch lange abrufbar und ein beliebtes Beweismittel.
Die Seite soll also schleunigst aus den Google-Index und -Cache verschwinden! Dies ist auch wichtig, sollte es schon zu Maßnahmen wie einer Abmahnung oder sonstiger Verfahren gekommen sein, da es ja möglich ist, die Inhalte auch aus dem Google-Cache zu entfernen, wenn auch nicht jeder weiß wie...
...aber das interessiert euren Gegner nicht die Bohne und es steht weiterer Ärger ins Haus.
Tipp 1:
Speichern in den Cache verhindern:
Wenn Ihr nicht wollt, dass eure Seiten im Google-Cache landen, auf jeden Fall auf Seiten mit risikoreichem Inhalt, sollte im Header der Seite folgende Anweisung stehen:
<meta content="NOARCHIVE" name="ROBOTS" />
Soll nur Google keine Seiten im Cache ablegen, ersetzt ROBOTS durch GOOGLEBOT!
Tipp 2:
Das Entfernen einer Seite aus dem Google-Index oder Cache:
Zunächst benötigt Ihr ein Konto bei Google!
Ruft Google.de auf -> über Google -> Informationen für Webmaster -> Webmastertools.
Richtet ein Konto ein, meldet eure Webseite an. Ihr erhaltet einen Code, der auf jeder Seite im Header eingebunden werden muss.
Neben vielen nützlichen Statistiken, Tipps und Tools könnt Ihr dort nun über dieses Konto eure Seiten aus dem Index nehmen lassen.
Index:
Zunächst muss die betreffende Seite vom Webserver gelöscht werden und beachtet unbedingt Tipp 3!
Über das Tool zum Entfernen von Webseiten könnt Ihr dann die Seite aus dem Index löschen lassen.
Google ist hier sogar sehr schnell, es dauert meistens nur ein paar Stunden, spätestens nach 24 Stunden und die Seite ist aus dem Google-Index und -Cache verschwunden.
Über den Stand werdet Ihr dort auch informiert und erhaltet eine Meldung, ob es geklappt hat oder nicht.
Nur Cache:
Dies funktioniert genau so wie oben beschrieben, allerdings löscht Ihr die Seite nicht, sondern bringt im Header folgenden Code an:
<meta content="NOARCHIVE" name="ROBOTS" />
Der Eintrag bleibt bestehen, gelöscht wird nur der Cache!
Tipp 3:
Probleme bei dem Entfernen einer Seite aus dem Google-Index:
Eigentlich könnt Ihr dort zum Entfernen jede Seite des Webs eintragen. Klar, als Seitenbetreiber würde ich mich freuen ;-)
Alleine wichtig für Google zum Entfernen aus dem Index ist, dass ein 404 HTTP Request vom Server ausgeben wird.
Nun entsteht ein Problem: Zwar generieren manche Provider eine error404 Fehlerseite, aber übermitteln nicht den 404 HTTP Request!
Dazu gehört z.B. auch 1&1. Für den Google-Bot ist also die Seite weiterhin verfügbar, ihn interessiert nur der 404 HTTP Request!
Ohne diesen 404 HTTP Request wird eine Seite NICHT aus dem Index gelöscht!
Ob euer Provider den 404 HTTP Request übermittelt, könnt Ihr hier prüfen:
HTTP-Header Test
Gebt dort eine Domain wie http://www.MeineDomain/nichtvorhanden.html ein und lasst euch die Analyse anzeigen.
Wird der 404 HTTP Request ausgegeben, ist alles ok, ansonsten weiter mit Tipp 4, insbesondere, wenn Ihr schon eine eigene erro404-Seite erstellt habt.
Tipp 4:
404 HTTP Request erzeugen:
Dieser Tipp funktioniert nur bei Providern, die eigene .htaccess zulassen! Alle Anderen sind leider außen vor, hier würde ich über einen Providerwechsel nachdenken, denn dieses Feature ist heute für mich für eine moderne Seite unabdingbar!
Ihr müsst eine eigene 404Error-Seite erstellen und dort zusätzlich auch den 404 HTTP Request übergeben.
Dies empfehle ich eh! Normalerweise ist ein Besucher bei Erhalt einer Error404-Seite verloren. Aber bei einer netten Seite, die dem Besucher auch die weiteren Links bietet, verweilt er vielleicht auf Eurer Seite!
Wie dies nun geht, das erfahrt Ihr hier:
Error404_Seite.html
Bisherige Kommentare: Kommentar schreiben»
