Unter URL Hijacking versteht man die „Entführung“ einer Internet-Domain aus den Verzeichnissen von Suchmaschinenanbietern. Die Ursache dafür ist in der Regel eine fehlerhafte (dynamisch generierte) Weiterleitung zwischen einer bestimmten Suchmaschine und einer Webseite. Die wohl schwerwiegendste Folge für betroffene Seiten ist die Tatsache, dass sie als Ergebnis des URL Hijacking nicht mehr in den Ergebnislisten der Suchmaschine auftauchen und somit von Anwendern nicht mehr gefunden werden können. Dies kann binnen kürzester Zeit zu einer enormen Reduktion an Besuchern der betroffenen Internetseite führen.
Technische Hintergründe des URL Hijacking
Insbesondere bei temporären Weiterleitungen kommt es immer wieder zu dem Problem, dass der vorübergehende Wechsel einer Adresse nicht korrekt abläuft. Verweist also Beispielsweise eine bestimmte URL im Rahmen einer temporären Weiterleitung auf eine alternative Adresse, geht der Suchmaschinenalgorithmus im Normalfall davon aus, dass die neu zugeordnete Seite früher oder später wieder unter der ursprünglichen Adresse erreichbar sein wird. Dabei wird allerdings nicht berücksichtigt, dass beide Adressen möglicherweise gar nichts miteinander gemein haben und die Suchmaschine ist nicht in der Lage zu erkennen, um welchen Seitentyp es sich handelt (beispielsweise ein Webverzeichnis oder eine innerhalb eines Verzeichnisses eingetragene Seite). Genauso wenig kann von der Suchmaschine festgestellt werden, dass es sich hierbei um eine inkorrekte Form der Weiterleitung handelt.
Problemstellungen im Bereich der dauerhaften und vorübergehenden Weiterleitungen
Wie bereits beschrieben, tritt URL Hijacking häufig im Rahmen von temporären Weiterleitungen auf. Grundsätzlich gibt es im Bereich des Internets mehrere Optionen, um Seitenanfragen über eine bestimmte Internetadresse auf eine andere Adresse umzuleiten. Dabei können die Gründe und Ursachen für eine solche Weiterleitung sehr unterschiedlich sein und jeweils ganz eigene Zielsetzungen verfolgen. Eine verbreitete Form der dauerhaften Weiterleitung stellt der Fall dar, bei dem aufgrund der Eingabe von Tippfehlern auf die korrekte (richtig geschriebene) Domain weitergeleitet wird. Dies kann unter Umständen auch aufgrund eines Umzugs oder Tauschs der Domain der Fall sein. Ebenso häufig werden permanente Weiterleitungen auf die richtige Hauptseite einer Internetpräsenz eingerichtet. Oftmals besteht die URL der Hauptseite aus einer längeren Zeichenfolge, aufgrund der Weiterleitung ist es jedoch möglich auch bei verkürzten Eingaben, die Benutzer auf die richtige Seite zu verweisen. Eine weitere Form der permanenten Weiterleitung ist dann gegeben, wenn bestimmte Inhalte innerhalb einer Webseite einen neuen Dateinamen erhalten und die konkrete Seite daher mittels der alten URL nicht mehr erreicht werden kann. So wäre es beispielsweise möglich, dass statt des Begriffs „Startseite“ auf die Bezeichnung „Hauptseite“ oder „Verzeichnis“ gewechselt wurde. Im Gegensatz dazu werden temporäre Weiterleitungen unter anderem dann verwendet, wenn bestimmte Inhalte für einen gewissen Zeitraum unter einer abgewandelten Adresse aufgerufen werden sollen. In der Regel ist in diesem Fall allerdings angedacht, die Inhalte künftig wieder unter der alten Adresse bereitzustellen – oder auch unter einer dritten, gänzlich anderen Adresse. Darüber hinaus gibt es noch eine dritte Variante, die beschreibt wie Weiterleitungen erfolgen können: der sogenannte Meta-Refresh, bei dem es allerdings nicht möglich ist festzustellen, ob es sich dabei um dauerhafte oder nur um vorübergehende Verweise handelt. Diese beiden Grundformen der Weiterleitung – also permanente und temporäre Weiterleitungen – werden in http mittels zweier Codes definiert und im Rahmen des http-Header an die Suchmaschine übermittelt, beziehungsweise sichtbar gemacht. Bedeutsam sind in diesem Zusammenhang der Code 301, der eine permanente Weiterleitung anzeigt, und der Code 302 für die vorübergehende Form der Weiterleitung. Über den Befehl 301 (Moved Permanently) im http-Header sollte also für die Suchmaschine ersichtlich sein, dass die neue Adresse nur für einen bestimmten Zeitraum relevant ist und in Zukunft wieder die ursprüngliche URL ihre Gültigkeit erhalten wird. Die meisten gebräuchlichen Suchmaschinen gehen mit den Definitionen innerhalb des http-Standards und den Codes aus dem http-Header konform. Würde (in einem konkreten Beispiel) die ursprüngliche Adresse mit Hilfe einer dauerhaften Weiterleitung auf eine zweite URL verweisen, gehen Suchmaschinen dementsprechend davon aus, dass ab sofort die entsprechenden Inhalte auch dauerhaft unter dieser zweiten Adresse verfügbar sein werden. Auf Basis dieser Annahme und in Bezug auf URL Hijacking tritt dann der Effekt ein, dass die zweite, neue URL in das Suchmaschinenverzeichnis aufgenommen wird, während die ursprüngliche Adresse aus diesem Index wieder gelöscht wird. In den meisten Fällen ist dieses Ergebnis auch gewünscht, da es sich wie beschrieben um permanente Weiterleitungen handelt. Damit soll garantiert werden, dass bestimmte Inhalte unter der richtigen URL aufzufinden sind und es keine Überschneidungen und Redundanzen gibt, es kann jedoch vorkommen, dass dieser Effekt auch Nachteile mit sich zieht. URL Hijacking ist deshalb insbesondere bei temporären Verweisen gefährlich und führt hier oftmals zu ungewünschten Ergebnissen. Bei der temporären Weiterleitung soll nur für eine bestimmte Zeit auf eine alternative URL verwiesen werden, in Zukunft allerdings wieder auf die ursprüngliche Adresse. Entsprechend dieser Form der Weiterleitung und auf Basis der http-Definitionen nimmt die Suchmaschine nun an, dass die Inhalte momentan unter einer neuen Adresse verfügbar sind, nach einiger Zeit aber wieder über die erste URL abgerufen werden können. Daher wird die neue URL meist gar nicht in ein Verzeichnis aufgenommen oder aber sogar ganz aus dem Index gelöscht. Sollte vom Inhaber der Webseite aus tatsächlich der Wunsch bestehen, dass es sich dabei nur um eine vorübergehende Zuweisung einer Alternativadresse handelt, ist diese Vorgehensweise der Suchmaschine gewünscht und sinnvoll. Im Falle, dass die neue, alternative Adresse jedoch von nun an die eigentliche Haupt-URL darstellen soll, kann es zu Problemen und gravierenden Nachteilen kommen.
Ursachen für URL Hijacking
Für das Phänomen des URL Hijacking gibt es mehrere Gründe, beziehungsweise existieren unterschiedliche Ursachen für das Verhalten von Webseitenbetreibern, bei dem Weiterleitungen erstellt werden, anstatt für diese fremden Inhalte Direkt-Links zur Verfügung zu stellen. Vor allem sogenannte dynamische Links stellen hierbei eine besondere Gefahr dar, da sie aus zugehörigen Datenbanken automatisch generiert werden und sich somit immer wieder verändern. Diese lassen sich relativ einfach an einem „?“ erkennen, welches sich oftmals in der Adresse befindet. Besonders geläufig im Bereich des URL Hijacking sind standardisierte Code 302 Verweise auch innerhalb der oft und gerne genutzten Skriptsprache PHP. Hier werden die temporären Weiterleitungen standardmäßig verwendet, außer der jeweilige Programmierer gibt explizit einen Statuscode an. Auch bei bekannten Suchmaschinen kommt es durchaus häufig vor, dass diese eine (wie bereits beschriebene) Meta-Refresh-Weiterleitung grundsätzlich als eine permanente Weiterleitung einstufen, wenn die Weiterleitungsverzögerung vergleichsweise kurz ist. Da es keine anderen Anhaltspunkte gibt, anhand denen festgestellt werden kann, ob es sich beim Meta-Refresh um einen dauerhaften oder vorübergehenden Fall handelt, wird bei längeren Verzögerungszeiten eine temporäre Code 302 Weiterleitung angenommen. Der Grund, weshalb es hier nach wie vor zu Missverständnissen und falschen Einstufungen kommt ist die Tatsache, dass viele Betreiber von Webseiten sich gar nicht darüber bewusst sind, dass sie überhaupt solche Verweise verwenden. Dadurch können der eigenen, viel öfter aber auch anderen Seiten erhebliche Nachteile entstehen. Meist ist die Wahrscheinlichkeit für URL Hijacking umso größer, je prominenter der PageRank der verlinkenden Seite im Vergleich zur verlinkten Webseite ist. Da ein hoher PageRank in der Regel auch zu einer größeren Vertrauenswürdigkeit und einem besseren Image der verlinkenden Seite führt, gehen die betroffenen Suchmaschinen oftmals rein automatisch davon aus, dass die http-Standards, auf denen sie ihre Entscheidungen treffen, korrekt implementiert und angewendet wurden. Darüber hinaus werden Seiten, die über einen hohen Rang verfügen, auch als für Benutzer und Suchende wichtiger eingestuft und bleiben schon alleine aus diesem Grund automatisch im Index der Suchmaschine gespeichert. Daher wird angenommen, dass beispielsweise eine temporäre Weiterleitung auch tatsächlich als eine solche gewünscht war – mögliche Irrtümer werden nicht berücksichtigt. Dies führt dazu, dass URL Hijacking in vielen Fällen als Programmfehler innerhalb der Suchmaschinen angesehen wird. Tatsächlich verhalten sich Suchmaschinen aber in aller Regel entsprechend den http-Standards und die Fehler geschehen tendenziell eher auf Seiten der Webmaster.
Zusammenfassung
URL Hijacking bezeichnet das Verschwinden einer Internet-Domain aus den Suchergebnissen, oft verursacht durch fehlerhafte Weiterleitungen zwischen Suchmaschinen und Webseiten. Dieser Prozess kann drastische Folgen für den Website-Traffic haben.
Technische Probleme treten häufig bei temporären Weiterleitungen auf. Suchmaschinenalgorithmen können nicht immer die Art der Weiterleitung oder die Relevanz der neuen URL erkennen, was zu fehlerhaften Indexierungen führen kann.
Es gibt verschiedene Arten von Weiterleitungen, sowohl dauerhafte als auch vorübergehende. Diese werden in HTTP durch die Codes 301 und 302 definiert. Fehlinterpretationen dieser Codes durch Suchmaschinen können zu URL Hijacking führen.
Die Ursachen für URL Hijacking sind vielfältig. Dynamische Links und standardisierte Code 302 Verweise, insbesondere in der Skriptsprache PHP, sind oft problematisch. Zudem spielen das Unwissen der Webmaster und der PageRank der betroffenen Seiten eine Rolle.
Ein hohes Maß an Vertrauenswürdigkeit und ein hoher PageRank einer Website können paradoxerweise das Risiko erhöhen, dass URL Hijacking auftritt. Fehler entstehen oft auf Seiten der Webmaster, werden jedoch als Programmfehler der Suchmaschinen angesehen.
Häufige Fragen und Antworten
Was versteht man unter URL Hijacking?
URL Hijacking bezeichnet das Verschwinden einer Internet-Domain aus den Suchergebnissen, oft verursacht durch fehlerhafte Weiterleitungen zwischen Suchmaschinen und Webseiten.
Welche technischen Hintergründe gibt es beim URL Hijacking?
Insbesondere bei temporären Weiterleitungen kommt es immer wieder zu dem Problem, dass der vorübergehende Wechsel einer Adresse nicht korrekt abläuft. Der Suchmaschinenalgorithmus geht im Normalfall davon aus, dass die neu zugeordnete Seite früher oder später wieder unter der ursprünglichen Adresse erreichbar sein wird. So werden möglicherweise Seiten nicht mehr in den Index aufgenommen und sind nicht mehr auffindbar.
Welche Problemstellungen gibt es im Bereich der Weiterleitungen?
Problemstellungen im Bereich der Weiterleitungen können auftreten, wenn beispielsweise aufgrund von Tippfehlern auf die falsche Domain weitergeleitet wird oder Inhalte unter einer temporären abgewandelten Adresse aufgerufen werden sollen. Es kann zu Missverständnissen oder fehlerhaften Indexierungen seitens der Suchmaschinen kommen.
Was sind die Ursachen für URL Hijacking?
Die Ursachen für URL Hijacking sind vielfältig. Dynamische Links und standardisierte Code 302 Verweise können problematisch sein. Oftmals sind sich Webmaster nicht bewusst, dass sie solche Verweise verwenden. Der PageRank einer Website kann ebenfalls ein Risikofaktor sein.