Internet Archive Hauptquartier
IMAGO/Depositphotos
Cyberangriff mit Folgen

Web-„Zeitmaschine“ auf wackligen Beinen

Das Internet Archive hat seit 1996 insgesamt über 860 Milliarden Einzelseiten aus dem Netz gespeichert – und ist damit das weltgrößte Archiv des World Wide Web. Ein Cyberangriff vergangene Woche legte das Archiv und seine „Wayback Machine“ für einige Tage komplett lahm. Seit Montag ist wieder – eingeschränkter – Zugriff möglich, doch die Attacke offenbarte ganz grundlegende Schwächen der digitalen Bibliothek, die sich vor allem durch Spenden finanziert.

Der Cyberangriff wurde von den Tätern selbst im Webarchiv in einem Pop-up-Fenster bekanntgegeben: „Haben Sie nicht auch das Gefühl, dass das Internet Archive auf Stelzen rennt und konstant vor einer katastrophalen Sicherheitspanne steht?“ Die Hackergruppe veröffentlichte die 31 Millionen Nutzerdaten, eine weitere Cyberattacke zwang die Seite in die Knie und machte sie tagelang unzugänglich.

Am Montag gab Brewster Kahle, Gründer des Archivs, auf dem Kurznachrichtendienst X bekannt, dass die „Wayback Machine“ wieder aufrufbar ist – allerdings mit starken Einschränkungen. Auch wenn sich die Situation in den kommenden Tagen weiter normalisiert: Der Angriff zeigte auf, dass das weltgrößte Archiv des digitalen Lebens recht zerbrechlich ist, aber eine ganz zentrale Rolle im Netz spielt.

Viertel des Webs zwischen 2013 und 2023 verschwunden

Denn ein Teil des Webs verschwindet täglich und für immer: Die BBC zitiert eine Studie, wonach ein Viertel der veröffentlichten Einzelseiten zwischen 2013 und 2023 einfach nicht mehr aufrufbar ist. Projekte wie das Internet Archive wollen diesem digitalen Vergessen entgegenwirken und speichern Kopien von Internetauftritten. Automatisiert werden Seiten aufgerufen, archiviert und zeitlich einsortiert.

Das Non-Profit-Unternehmen hinter der „Wayback Machine“ wurde 1996 von Kahle gegründet, der damals auch für Alexa arbeitete – eine Firma, die die Beliebtheit von Websites analysierte. Die erste Seite in der „Wayback Machine“ datiert vom 10. Mai 1996, seither archivierte das Internet Archive Milliarden verschiedener Seiten zu verschiedenen Zeitpunkten: ORF.at wurde erstmals 1997 gespeichert – und bis heute über 188.000 weitere Male.

Laptop-Bildschirm zeigt Website „Wayback Machine“
ORF
Die „Wayback Machine“ speichert seit 1996 Websites aus aller Welt

Mehr als reines Website-Archiv

Wichtig ist das nicht nur, um einen Eindruck zu bekommen, wie sich das Internet entwickelt hat. Es ist eine wichtige zeitgeschichtliche Quelle, hält etwa die erstmals im großen Rahmen im Netz stattgefundene Berichterstattung zu den Ereignissen vom 11. September 2001 fest. Auch für Wikipedia ist das Internet Archive wesentlich: Um Quellenverweise auch für etwaige gelöschte Seiten zu erhalten, wird in der Regel auf archivierte Seiten aus dem Archiv verwiesen.

Längst sind aber nicht nur Websites, sondern auch zahlreiche andere Medien im Internet Archive abrufbar – angefangen von Buchscans über Musik und Videospiele bis hin zu Videos. Im Gegensatz zu anderen Archiven ist praktisch das gesamte Material öffentlich zugänglich.

Kaum Anreize für Archivierung

Für Mark Graham, Direktor der „Wayback Machine“, gebe es für Firmen wenige Anreize, Daten dauerhaft zu speichern, dafür aber zahlreiche Gefahren, dass Daten verloren gehen, sagte er gegenüber der BBC. „Es gibt vielfältige Risiken. Nicht nur, dass die Technologie aufgibt – auch wenn das sicherlich passieren kann. Viel wesentlicher ist jedoch, dass Institutionen versagen oder Unternehmen in Konkurs gehen.“

Bestrebungen, das Netz zu archivieren, gibt es zwar von einigen Staaten – dann aber stark eingegrenzt, da die Speicherung mit enormen Kosten verbunden ist. Die USA speichern etwa in erster Linie die Auftritte von Behörden. In Österreich archiviert die Nationalbibliothek hierzulande Websites. Das Internet Archive will hingegen möglichst viele Seiten aus aller Welt dauerhaft erhalten, wird aber vor allem durch Spenden und Partnerschaften finanziert.

Auch Klagen erschweren Arbeit

Nicht nur die letzte Cyberattacke zeigt, dass das Internet Archive damit auf sehr wackligen Beinen steht. Schon in der Vergangenheit gab es Angriffe auf die Seite, und finanzielle Probleme verschärften die Situation zusätzlich. Hinzu kommen zahlreiche gerichtliche Auseinandersetzungen: Dass die Öffentlichkeit auf das archivierte Material zugreifen kann, sorgte in der Vergangenheit für Urheberrechtsstreitigkeiten. Das Archiv arbeitet oft in einer rechtlichen Grauzone.

Erst im September wurde wegen des Verleihs von digitalen Büchern ein Einspruch des Archivs abgewiesen. Auch mit Musiklabels liegt man im Streit, hier könnte eine Niederlage rund 400 Mio. US-Dollar (rund 365 Mio. Euro) kosten – und damit das Überleben des Archivs gefährden. Zwar dürfte eine kürzlich angekündigte Zusammenarbeit mit Google – das sein eigenes Archiv deaktivierte – lukrativ sein, unklar ist aber, ob diese das Bestehen dauerhaft sichern kann.

Cyberangriff als Weckruf

So könnte der Hack und die damit einhergehende Botschaft auch als Weckruf verstanden werden: Das Internet Archive ist aus dem Web-Alltag nicht wegzudenken, ein Verschwinden würde auch die Glaubwürdigkeit von Projekten wie Wikipedia dauerhaft ankratzen. Vor allem aber würde ein Ende des Archivs auch einen nicht unwesentlichen Teil der Geschichte des Internets für immer auslöschen. Gerade in einer Zeit, in der das Netz als Selbstverständlichkeit gesehen wird, könnte das eine dauerhafte Lücke in der Geschichtsschreibung hinterlassen.