Toter Link
Ein toter oder defekter Verweis bzw. engl. Link oder auch Totlink bzw. englisch Dead Link ist ein Hyperlink im World Wide Web, der auf eine nicht (mehr) vorhandene Ressource (zum Beispiel eine Webseite oder Datei) zeigt. Beim Anwählen des URI liefert der Webserver normalerweise eine Antwort mit dem HTTP-Statuscode 404 Not Found (die angeforderte Ressource konnte nicht gefunden werden) bzw. 410 Gone (die Ressource existiert nicht mehr).
Verweise auf nicht existierende Stellen sind auch aus gedruckten Nachschlagewerken bekannt.
Inhaltsverzeichnis
Ursachen
Tote Links sind ein bislang ungelöstes Problem des Hypertextes und im Kern darauf zurückzuführen, dass das Internet ein dezentrales Netzwerk ist. Daher kann die Integrität desselbigen niemals sichergestellt werden.
Die Gründe für das Existieren von toten Links können sehr unterschiedlich sein und vor allem an sehr unterschiedlichen Stellen auftreten. In der Praxis häufig anzutreffende Gründe sind unter anderem:
- Die Datei, auf die die URL verweist, ist verschoben, umbenannt oder gelöscht worden.
- Der Link auf der Ursprungseite ist fehlerhaft angegeben, beispielsweise bei der Groß- oder Kleinschreibung im Pfad (URIs sind an bestimmten Stellen case sensitive).
- Die gesuchte Domain ist neu bei einem Registrar vergeben worden und die Website selbst noch ohne jeden Inhalt.
- Der Webserver ist nicht (mehr) erreichbar, beispielsweise wegen Netzproblemen oder weil der Rechner abgeschaltet ist.
- Der Host- bzw. Domainname existiert nicht (mehr) oder kann nicht im DNS aufgelöst werden.
Auswirkung
Die Problematik bei nicht mehr vorhandenen URLs liegt im Wesentlichen daran, dass verlinkende Seiten von der Nichtexistenz nicht informiert werden bzw. nicht informiert werden können. So haben vor allem Suchmaschinen oft noch Webseiten indiziert, die seit Wochen oder Monaten nicht mehr existieren.
Tote Links wirken sich bei Suchmaschinen auch auf die Qualität der Suchergebnisse aus. Bei einigen Berechnungsmethoden des PageRanks, ein von dem Suchmaschinenbetreiber Google eingeführtes Verfahren zur Gütebestimmung von Webseiten, spielen tote Links eine Rolle (Lösung eines Eigenvektorproblems) und werden vor der Berechnung zunächst entfernt. Üblicherweise werden sie im letzten Schritt des numerischen Iterationsprozesses jedoch wieder eingefügt, so dass auch diesen Seiten ein PageRank zugewiesen wird.
Für das Ungültigwerden von URLs im Laufe der Zeit hat sich der englische Terminus link rot (etwa: „Linkverrottung“) etabliert. Über das Ausmaß gibt es verschiedene Schätzungen: Eine Untersuchung digitaler Bibliotheken hatte zum Ergebnis, dass etwa 3 % der Objekte nach einem Jahr nicht mehr erreichbar waren.<ref>Michael L. Nelson, B. Danette Allen: Object Persistence and Availability in Digital Libraries. In: D-Lib Magazine. 8, Nr. 1, 2002. doi:10.1045/january2002-nelson.</ref> Die Bookmarking-Website Pinboard berichtete 2014, dass sie eine recht stabile Linkrot-Rate von 5 % pro Jahr beobachte.<ref>Maciej Cegłowski: Web Design: The First 100 Years (englisch) 9. September 2014. Abgerufen am 22. Juli 2015.</ref>
Lösungsmöglichkeiten
Eine Möglichkeit, die allerdings eher die Symptome der toten Links bekämpft, ist die Wayback Machine des Internetarchivs. Durch chronologische Kopien von Webseiten kann Zugriff auf teilweise längst nicht mehr im Original vorhandene Webseiten gewährt werden.
Ursachenbekämpfung betreiben hingegen Gremien wie das W3C mit der Kampagne Cool URIs don’t change,<ref>http://www.w3.org/Provider/Style/URI (engl.)</ref> die in der Öffentlichkeit das Bewusstsein für die Notwendigkeit persistenter URLs wecken. Zudem gibt es bereits Systeme, die das Ziel von unabänderlichen URLs verfolgen, beispielsweise das des Persistent Uniform Resource Locators.
Mythos der Entstehung
Der Fehlercode „404“ soll dadurch entstanden sein, dass in der Anfangszeit des Internets der Server, der diesen Fehler durch fehlende Dateien hervorrief, im Raum 404 im CERN stand, wo der Ursprung des World Wide Webs zu finden ist. Diese Geschichte ist jedoch als eine Moderne Sage einzustufen. In Wirklichkeit basiert der Fehlercode auf keiner lebendigen Geschichte wie dieser, sondern ist lediglich ein Fehlercode unter insgesamt 27 verschiedenen, die im HTTP-Standard als „Client-Fehler“ festgelegt sind.
Weblinks
- w3.org – Status Code Definitions – Statuscode-Definition
Beispiele toter Links
- ftp://gibt-es-nicht.example.com/ – nicht erreichbare (Sub-)Domain
Einzelnachweise
<references />