03.11.2024

Il destino dellâ€™Internet Archive Ã¨ appeso a un filo

La piÃ¹ grande biblioteca digitale del mondo Ã¨ invischiata in una serie di battaglie legali che rischiano di cancellare la memoria collettiva del web

Il fondatore dell'Internet Archive all'interno della sede dell'organizzazione a San Francisco

Se entrate nella sede dell'Internet Archive il venerdÃ¬ dopo pranzo, il momento dedicato alle visite del pubblico, Ã¨ probabile che veniate accolti dal suo fondatore Brewster Kahle, che Ã¨ anche il piÃ¹ allegro sostenitore della piÃ¹ famosa biblioteca di internet.

Non si puÃ² non notare l'edificio. Sembra essere stato progettato come una sorta di attrazione di Las Vegas a tema greco, e poi infilato a forza nel quartiere nebbioso e mite di Richmond, a San Francisco. Una volta superate le bianche colonne corinzie dell'ingresso, Kahle vi mostrerÃ il cabinato vintage di Prince of Persia e un grammofono che puÃ² riprodurre i cilindri fonografici centenari esposti nell'atrio. Vi condurrÃ poi nella sala principale, piena di file di banchi di legno che vanno verso un pulpito. Le modanature barocche del soffitto incorniciano una grande cupola di vetro colorato. Prima di diventare la sede dell'Internet Archive, l'edificio ospitava una chiesa del movimento Scienza Cristiana.

Una giornata all'Internet Archive

Ho compiuto questo pellegrinaggio in un pomeriggio ventilato dello scorso maggio. Insieme a una dozzina di altri visitatori, ho seguito il 63enne Kahle â€“ che indossava un abito arancione sdrucito e occhiali tondi con montatura a filo â€“ mentre ci mostrava il lavoro della sua vita. Quando la luce del pomeriggio colpisce la cupola della grande sala, conferisce un'aureola a tutti i presenti. Ma soprattutto a Kahle, i cui riccioli d'argento catturano il sole: il fondatore dell'Internet Archive predica il suo vangelo con una dedizione amichevole, gesticolando e inframmezzando le sue parole con le risate. "Penso che oggi la gente si senta investita dalla tecnologia â€“ dice â€“. Dobbiamo riumanizzarla".

Nella sala grande, dove si conclude il tour, centinaia di statue di argilla colorate fatte a mano sono allineate alle pareti. Rappresentano i dipendenti dell'Internet Archive: Ã¨ il modo bizzarro scelto da Kahle per immortalare la sua cerchia. Sono belle e bizzarre, ma non siamo ancora arrivati al gran finale. Contro la parete di fondo c'Ã¨ una torre di server neri ronzanti, che contengono circa il 10% dello sconfinato patrimonio digitale dell'Internet Archive, che comprende 835 miliardi di pagine web, 44 milioni tra libri e testi e 15 milioni di registrazioni audio, e altro ancora. Le piccole luci su ogni server si accendono e si spengono ogni volta che qualcuno apre una vecchia pagina web, consulta un libro o utilizza in altro modo i servizi dell'archivio. Questo sfarfallio costante e aritmico crea uno spettacolo di luci ipnotico. Nessuno ne Ã¨ piÃ¹ compiaciuto di Kahle.

Brewster Kahle, il fondatore di Internet Archive

Photograph: Gabriela Hasbun

Non Ã¨ esagerato affermare che l'archiviazione digitale, cosÃ¬ come la conosciamo, non esisterebbe senza l'Internet Archive. Il suo progetto piÃ¹ famoso, la Wayback Machine, Ã¨ un archivio di pagine web che funziona come una videocassetta su cui Ã¨ registrato il web. L'Internet Archive Ã¨ una delle piÃ¹ importanti organizzazioni al mondo a occuparsi di conservazione storica, la Wayback Machine Ã¨ assurta al ruolo di valvola di sicurezza contro l'oblio digitale. La reputazione che si Ã¨ guadagnata l'organizzazione Ã¨ meritata: senza di essa, il mondo perderebbe la sua migliore risorsa pubblica sulla storia di internet.

I suoi dipendenti sono alcuni dei suoi fedeli piÃ¹ devoti: "Ãˆ il meglio del vecchio internet ed Ã¨ il meglio della vecchia San Francisco, e per molti versi nessuna delle due cose esiste piÃ¹ â€“ spiega il direttore dei servizi bibliotecari Chris Freeland, un altro dipendente di lunga data, che ama il ciclismo e predilige lo smalto nero â€“. Ãˆ una finestra sull'etica del web e sulla cultura di San Francisco della fine degli anni '90: il lato piÃ¹ croccante, prima che diventasse tutto regno dei tech bro. Ãˆ utopico, Ã¨ idealista".

Le sculture dei dipendenti dell'Internet Archive

Photograph: Gabriela Hasbun

I guai legali

Ma anche l'Internet Archive ha i suoi nemici. Dal 2020 Ã¨ impantanato in una serie di processi. Come la causa Hachette v. Internet Archive, in cui alcuni editori hanno accusato l'organizzazione non profit di aver violato il diritto d'autore mettendo a disposizione versioni digitalizzate di libri fisici. Ma c'Ã¨ anche il procedimento UMG Recordings v. Internet Archive, in cui diverse etichette musicali affermano che l'Internet Archive abbia infranto il copyright.

In entrambi i casi l'Internet Archive ha incentrato la sua difesa sulla dottrina del fair use, sostenendo di essere autorizzato a utilizzare materiali protetti da copyright in quanto ente non commerciale. Nel 2023 l'organizzazione ha vinto il primo grado della causa contro gli editori, ma recentemente ha perso in appello. L'Archivio potrebbe fare ricorso alla Corte Suprema degli Stati Uniti, ma non nell'immediato ("non abbiamo deciso", mi ha detto Kahle il giorno dopo la decisione). All'inizio di quest'anno inoltre un giudice ha respinto il tentativo di archiviare la causa avviata delle major musicali. Kahle dice che sta pensando di patteggiare, ammesso che sia un'opzione percorribile.

Il peso di questi procedimenti legali rischia di schiacciare Internet Archive. Soprattutto la causa contro le etichette discografiche potrebbe rivelarsi una minaccia esistenziale, a fronte di possibile multe da centinaia di milioni di dollari.

Internet ha affidato la sua memoria collettiva a questa istituzione idiosincratica. E ora si trova di fronte alla prospettiva di perdere tutto.

La nascita dell'Internet Archive

Kahle era ossessionato dalla creazione di una biblioteca digitale fin da giovane, una vocazione che lo ha spinto a studiare intelligenza artificiale al Mit. "Volevo costruire la biblioteca del tutto, e avevamo bisogno di computer abbastanza grandi per poterla gestire", raconta.

Dopo essersi laureato nel 1982, ha lavorato presso la Thinking Machines Corporation, una startup di supercomputing. LÃ¬ ha sviluppato un programma chiamato Wide Area Information Server (Wais), un modo per cercare dati su computer remoti. Ha lasciato l'azienda per creare una startup con lo stesso nome, che ha venduto ad Aol nel 1995. L'anno successivo, dalla sua soffitta, ha lanciato un progetto palindromo: AI e IA.

Niente a che vedere con l'intelligenza artificiale in questo caso. AI era l'acronimo di una societÃ chiamata Alexa Internet ("Alexa" Ã¨ un riferimento alla biblioteca di Alessandria). Poi c'erÃ IA, cioÃ¨ l'Internet Archive, una societÃ senza scopo di lucro. I due progetti erano interconnessi: Alexa Internet effettuava il crawling del web per poi donare quello che trovava all'Internet Archive. Ma Kahle non riusciva a far funzionare il modello commerciale di AI. E quando Amazon gli fece un'offerta nel 1999, accettare gli sembrÃ² prudente. Il colosso pagÃ² 250 milioni di dollari in azioni per acquistare Alexa, separando l'AI dall'IA e facendo di Kahle un uomo ricco.

Kahle rimase a lavorare ad Alexa per qualche anno, prima di andarsene nel 2002 per concentrarsi sull'Internet Archive. Da allora l'organizzazione Ã¨ diventata la sua vocazione: "Tutto il suo essere Ã¨ impegnato nell'Archivio â€“ dice Pam Samuelson, studiosa di copyright, che conosce Kahle dagli anni '90 â€“. Lo vive e lo respira".

Se la Silicon Valley ha un signor Fezziwig, questo Ã¨ Kahle. Non Ã¨ un asceta: ha una bella barca a vela nera ancorata in uno yacht club di lusso. Ma la sua vita quotidiana Ã¨ modesta. Va al lavoro in bicicletta e si veste come uno a cui non interessano i vestiti. Anche se un tempo amava il Burning Man â€“ lui e sua moglie, Mary Austin, che ha sposato al festival nel 1992 â€“ ora pensa che sia diventato troppo grande. Ma quello che ama davvero, e piÃ¹ di ogni altra cosa, Ã¨ il suo lavoro.

La sede dell'Internet Archive

Photograph: Gabriela Hasbun

Kahle Ã¨ ora l'allegro custode di un catalogo eccezionalmente fornito, che abbraccia ogni sorta di media digitali e fisici, dai videogiochi classici alle registrazioni di concerti dal vivo, dalle riviste e dai giornali ai libri di tutto il mondo. Di recente ha fatto il backup alle istituzioni culturali dell'isola di Aruba. Ãˆ uno strumento essenziale per ogni tipo di ricerca, da quella giuridica â€“ in particolare per quanto riguarda il diritto dei brevetti â€“ al giornalismo: "Ci sono altri strumenti di archiviazione online â€“ dice Craig Silverman, giornalista di ProPublica â€“, ma nessuno di questi Ã¨ paragonabile a Internet Archive".

Quello che rende unico l'Internet Archive Ã¨ la sua volontÃ di spingersi oltre i confini in modi sconosciuti alle biblioteche tradizionali. Anche la Biblioteca del Congresso statunitense archivia il web, ma solo dopo aver avvisato i siti web che setaccia (e spesso chiedendo il permesso).

"L'Internet Archive Ã¨ sempre stato un po' rischioso", afferma Ian Milligan, storico dell'UniversitÃ di Waterloo. La sua utilitÃ si intreccia con il suo vecchio approccio al copyright. Kahle e la sua organizzazione fecero causa al governo americano piÃ¹ di vent'anni fa, contestando il modo in cui due leggi â€“ il Copyright Renewal Act del 1992 e il Copyright Term Extension Act del 1998 â€“ avevano ampliato la legge sul diritto d'autore. Persero la causa, ma certo non il desiderio di continuare ad andare per la loro strada.

Una di queste spinte Ã¨ arrivata nel 2005. All'epoca, il compianto hacker Aaron Swartz lavorava spesso ai progetti dell'Internet Archive e, insieme a Kahle, aveva ideato e guidato lo sviluppo di una nuova iniziativa chiamata Open Library. L'obiettivo era quello di creare una pagina web per ogni libro del mondo. Kahle vedeva il progetto come un'alternativa a Google Books, non guidata da interessi commerciali ma dall'ideale della libera informazione.

Oltre al tentativo di catalogare tutti i libri mai esistiti, il progetto punta a renderne disponibili le copie ai lettori, scannerizzando i libri fisici e poi permettendo alle persone di consultarne versioni digitalizzate. Per oltre un decennio, il progetto ha utilizzato una struttura chiamata prestito digitale controllato (CDL), in cui i libri digitalizzati sono trattati come quelli fisici e non come ebook. I libri prestati sono stati acquistati da Internet Archive o donati da altre biblioteche, organizzazioni o privati; secondo i principi del CDL, le biblioteche che possiedono una copia fisica di un libro dovrebbero essere in grado di prestarlo digitalmente.

Una dipendente dell'Internet Archive al lavoro.

Photograph: Gabriela Hasbun

Il progetto si rivolge principalmente ai ricercatori che hanno difficoltÃ a reperire libri specifici, piuttosto che ai lettori occasionali: "Provate a prendere uno dei nostri libri e poi a leggerlo: Ã¨ un'impresa", dice Kahle. Ãˆ la veritÃ . Rispetto a un normale ebook su un Kindle, una scansione sfocata di un libro fisico sullo schermo di un computer Ã¨ come la musica di un piccolo altoparlante iPhone paragonata a quella diffusa da un sistema audio surround Bose. La maggior parte di chi prende in prestito un libro tramite il servizio lo utilizza per meno di cinque minuti.

In genere le biblioteche che ottengono in licenza gli ebook hanno un numero limitato di prestiti; se smettono di pagare, il libro sparisce. Il CDL Ã¨ un tentativo di dare alle biblioteche un maggiore controllo sul loro inventario e di ampliare l'accesso ai libri di una collezione che esistono solo come copie fisiche.

Per anni gli editori hanno ignorato le scansioni dell'Internet Archive. Ma durante la pandemia hanno cambiato approccio, dopo che l'Internet Archive aveva iniziato a prendersi troppe libertÃ con il CDL.

Nel marzo 2020, mentre le scuole e le biblioteche chiudevano improvvisamente, gli Archivers si sono trovati di fronte a un dilemma. La domanda di ebook superava di gran lunga la loro capacitÃ di prestarli rispettando i restrittivi contratti di licenza, e non c'era modo di dare in prestito libri che esistevano solo in forma fisica. L'Internet Archive ha quindi preso una decisione coraggiosa, permettendo a piÃ¹ persone di prendere in prestito simultaneamente le versioni digitali dello stesso libro, attraverso un nuovo programma ribattezzato National Emergency Library. â€œAbbiamo agito su richiesta di bibliotecari, educatori e scrittori", dice Chris Freeland.

Kahle ricorda di aver pensato che l'Internet Archive avrebbe dovuto fare tutto il possibile per espandere l'accesso alle opere. Credeva di poter contare su un largo sostegno: â€œAbbiamo raccolto le firme di oltre 100 biblioteche che hanno detto: â€˜Aiutateciâ€™", spiega.

Dave Hansen, oggi direttore esecutivo dell'associazione no-profit Authors Alliance, all'epoca era un bibliotecario della Duke University. â€œAvevamo enormi difficoltÃ a procurare i libri ai nostri studenti â€“ dice â€“. Quello che hanno fatto Ã¨ stato in buona fede".

La collezione dell'Internet Archive comprende anche vecchi giornali e periodici da tutto il mondo

Photograph: Gabriela Hasbun

Non tutti perÃ² erano d'accordo. Importanti scrittori hanno criticato con veemenza il progetto, cosÃ¬ come la Authors Guild e la National Writers Union, rispettivamente un'associazione e un sindacato degli autori americani: "Non sono una biblioteca. Le biblioteche comprano libri e rispettano il copyright. Sono dei truffatori che si atteggiano a santi", ha scritto su Twitter lo scrittore James Gleick (che oggi sostiene ancora che l'Internet Archive non sia una biblioteca, pur ammettendo che "truffatori Ã¨ un po' troppo").

Lotta per la sopravvivenza

Internet Archive si Ã¨ ritrovato nella sua prima vera e propria crisi di immagine pubblica. Nel giugno 2020 una coalizione di case editrici ha fatto causa all'organizzazione, accusandola di violare la legge sul copyright. Poche settimane dopo, l'Internet Archive ha cancellato la National Emergency Library ed Ã¨ tornato al suo tradizionale sistema di prestiti limitati. La mossa perÃ² non ha fermato gli editori.

Le case editrici e i loro sostenitori sostengono che il comportamento dell'ente abbia danneggiato gli autori: "L'Internet Archive sostiene che sia giusto fare e distribuire a un pubblico globale copie non autorizzate dell'opera di un autore â€“ dice a Wired Us Terrance Hart, consigliere generale dell'Associazione degli editori americani â€“. Immaginate se tutti iniziassero a fare lo stesso. L'unica minaccia esistenziale Ã¨ quella che lâ€™Internet Archive rappresenta per il sostentamento degli autori e per il sistema del copyright nell'era digitale".

Dopo l'avvio della causa, oltre mille scrittori (tra cui Naomi Klein e Daniel Ellsberg) hanno firmato una lettera a sostegno delle biblioteche e dell'Internet Archive. Un autore favorevole al progetto, Chuck Wendig, ha cambiato idea pubblicamente dopo aver criticato sull'allora Twitter il progetto. Anche alcuni scrittori che attualmente appartengono e sostengono la Authors Guild, come Joanne McNeil, si sono detti convinti sostenitori dell'Archivio. La scrittrice a volte legge i libri fuori catalogo utilizzando il servizio di prestito, che considera ancora uno strumento vitale. "Spero che i miei libri siano nel progetto Open Library", spiega, aggiungendo che Ã¨ consapevole del fatto che i suoi libri, acclamati dalla critica ma di modesta popolaritÃ , non sono molto diffusi. "Almeno saprÃ² che in questo modo c'Ã¨ un posto dove la gente puÃ² trovarli".

Le dimostrazioni di sostegno non hanno cambiato le cose. Nel marzo 2023, l'Internet Archive ha perso il primo grado di giudizio, e a settembre Ã¨ arrivata la sconfitta in appello. Il tribunale ha respinto le argomentazioni dell'organizzazione sul fair use, sottolineando che l'Archive non ha dimostrato di non danneggiare finanziariamente gli editori. Nel frattempo, le spese legali continuano ad accumularsi.

Dopo la sentenza iniziale nella causa Hachette v. Internet Archive, le parti hanno concordato i termini di un accordo. Kahle ha confermato che l'ente riesce a sopravvivere finanziariamente grazie all'aiuto dei donatori. Se l'Internet Archive deciderÃ di non fare di nuovo ricorso, dovrÃ rispettare i termini dell'accordo. Un duro colpo, ma non il colpo di grazie.

Uscire indenni dall'altro procedimento in corso potrebbe essere molto piÃ¹ difficile. Nel 2023, diverse grandi case discografiche, tra cui Universal Music Group, Sony e Capitol, hanno fatto causa all'Internet Archive per il suo Great 78 Project, un archivio digitale che custodisce una collezione di registrazioni di album di nicchia in formato obsoleto noto come 78, utilizzato dal 1890 alla fine degli anni Cinquanta. La denuncia sostiene che il progetto "mina il valore della musica" e cita 2.749 violazioni del copyright, il che significa che il risarcimento potrebbe superare i 400 milioni di dollari.

Lo scantinato dell'Internet Archive

Photograph: Gabriela Hasbun

Anche in questo caso la difesa si basa sul fair use. L'Internet Archive sostiene che la conservazione di versioni obsolete di questi dischi rende la storia accessibile al pubblico. La legge americana sul diritto d'autore Ã¨ notoriamente imprevedibile e alcuni giudicano la strategia processuale dell'organizzazione traballante.

James Grimmelmann, professore di diritto digitale e dell'informazione alla Cornell University, ritiene che le etichette stiano "gonfiando enormemente il danno commerciale" causati dal progetto. Ma anche se ogni registrazione viene consultata in media solo una volta al mese. Grimmelmann non Ã¨ convinto che questo aspetto sia importante: "Stanno riproducendo direttamente queste opere â€“ commenta â€“ e questo Ã¨ un passaggio molto difficile per un giudice".

Potrebbero passare anni prima che il caso arrivi al dunque, il che significa che l'incertezza sul futuro di Internet Archive Ã¨ destinata a persistere, e potenzialmente a diffondersi. E se il caso si risolvesse con un accordo o una vittoria per l'industria discografica, altri titolari di copyright potrebbero seguire l'esempio del settore e fare causa.

Internet senza Internet Archive?

Perdere l'Internet Archive Ã¨ una prospettiva spaventosa: "C'Ã¨ l'errata percezione che le cose sul web siano per sempre, ma in realtÃ non Ã¨ cosÃ¬", afferma Craig Silverman, secondo il quale la scomparsa dell'organizzazione no-profit renderebbe certi studi e relazioni "molto piÃ¹ difficili, se non impossibili", oltre a rappresentare la perdita di un bastione della nostra memoria collettiva.

Nel frattempo, a settembre Google e l'Internet Archive hanno annunciato una partnership per consentire agli utenti di visualizzare le vecchie versioni dei siti web in Search tramite la Wayback Machine.

Ma la no-profit ha anche altri problemi oltre a quelli legali. Per cominciare, archiviare il web le cose Ã¨ sempre piÃ¹ difficile. Come mi ha spiegato il direttore della Wayback Machine Mark Graham, l'ascesa delle applicazioni con funzioni come il livestreaming (soprattutto se limitate a determinati sistemi operativi) rappresenta una sfida tecnica. Ma anche i paywall sono un ostacolo, cosÃ¬ come l'enorme e crescente quantitÃ di contenuti: "C'Ã¨ cosÃ¬ tanto materiale â€“ dice Graham â€“. Come si fa a sapere a cosa dare prioritÃ ?".

E poi c'Ã¨ l'intelligenza artificiale. Finora l'Internet Archive ha eluso o Ã¨ stato risparmiato dai nuovi controlli sul web crawling legato alla raccolta dei dati di addestramento dell'AI. Lo scorso giugno, per esempio, quando Reddit ha annunciato l'aggiornamento della sua politica sullo scraping, la piattaforma ha specificato che ia "soggetti in buona fede" come l'Internet Archive avrebbero potuto continuare a ricorrere alla pratica.

L'ascesa dell'intelligenza artificiale ha giÃ inasprito l'atteggiamento di alcuni creativi nei confronti dell'atteggiamento dell'Internet Archive sul copyright. Mentre Kahle vede la sua creazione come una biblioteca schierata dalla parte dei piccoli, gli oppositori contestano strenuamente questa visione. Dipingono Kahle come un lupo tecnologico travestito da bibliotecario, fermo a una mentalitÃ piÃ¹ adatta all'era di Napster. L'Internet Archive sta combattendo le battaglie di 20 anni fa, quando dire "editori cattivi, tutto ciÃ² che danneggia gli editori Ã¨ buono" era semplice, dice Neil Turkewitz, un ex dirigente della Recording Industry Association of America. "Ma questo non Ã¨ il mondo in cui viviamo", aggiunge.

Una parte dei server che contengono la vasta collezione dell'Internet Archive. Ogni volta che qualcuno accede a un libro, a un sito web, a un film, a una canzone o a un altro file, lampeggia una luce .

Photograph: Gabriela Hasbun

Quando gli ho parlato su Zoom, poco dopo aver saputo che l'Internet Archive aveva perso il ricorso, Kahle Ã¨ apparso agitato. Un profeta di internet che vaga nel deserto. Era appollaiato di fronte a scogliere frastagliate durante un'escursione vicino ad Arles, in Francia, con un cappellino da baseball blu tirato sui capelli, le guance arrossate dal sole e la sua solita affabilitÃ offuscata da un senso di sconforto. Non aveva saputo in anticipo della data della sentenza, cosÃ¬ ha interrotto la sua vacanza di una settimana: "Ãˆ davvero deprimente", dice.

Mentre siede su una roccia con il telefono in mano, il fondatore della piÃ¹ grande biblioteca di internet dichiara che il sistema giuridico statunitense Ã¨ rotto. Non pensa che l'ultima sentenza sia la fine dei processi: "Credo che il cartello del copyright stia facendo passi da gigante", dice. Ma in lui non c'Ã¨ traccia di rimpianto, solo una rinnovata convinzione del fatto che quello che sta facendo sia giusto: "Abbiamo una grande opportunitÃ . Ãˆ il sogno di Internet â€“ spiega â€“. E siamo noi a perderla". La sua sembra piÃ¹ una preghiera che una dichiarazione.

Questo articolo Ã¨ comparso originariamente su Wired US.

Una giornata all'Internet Archive

I guai legali

La nascita dell'Internet Archive

Lotta per la sopravvivenza

Internet senza Internet Archive?

Le storie da non perdere di Wired