Se entrate nella sede dell'Internet Archive il venerdì dopo pranzo, il momento dedicato alle visite del pubblico, è probabile che veniate accolti dal suo fondatore Brewster Kahle, che è anche il più allegro sostenitore della più famosa biblioteca di internet.
Non si può non notare l'edificio. Sembra essere stato progettato come una sorta di attrazione di Las Vegas a tema greco, e poi infilato a forza nel quartiere nebbioso e mite di Richmond, a San Francisco. Una volta superate le bianche colonne corinzie dell'ingresso, Kahle vi mostrerà il cabinato vintage di Prince of Persia e un grammofono che può riprodurre i cilindri fonografici centenari esposti nell'atrio. Vi condurrà poi nella sala principale, piena di file di banchi di legno che vanno verso un pulpito. Le modanature barocche del soffitto incorniciano una grande cupola di vetro colorato. Prima di diventare la sede dell'Internet Archive, l'edificio ospitava una chiesa del movimento Scienza Cristiana.
Una giornata all'Internet Archive
Ho compiuto questo pellegrinaggio in un pomeriggio ventilato dello scorso maggio. Insieme a una dozzina di altri visitatori, ho seguito il 63enne Kahle â che indossava un abito arancione sdrucito e occhiali tondi con montatura a filo â mentre ci mostrava il lavoro della sua vita. Quando la luce del pomeriggio colpisce la cupola della grande sala, conferisce un'aureola a tutti i presenti. Ma soprattutto a Kahle, i cui riccioli d'argento catturano il sole: il fondatore dell'Internet Archive predica il suo vangelo con una dedizione amichevole, gesticolando e inframmezzando le sue parole con le risate. "Penso che oggi la gente si senta investita dalla tecnologia â dice â. Dobbiamo riumanizzarla".
Nella sala grande, dove si conclude il tour, centinaia di statue di argilla colorate fatte a mano sono allineate alle pareti. Rappresentano i dipendenti dell'Internet Archive: è il modo bizzarro scelto da Kahle per immortalare la sua cerchia. Sono belle e bizzarre, ma non siamo ancora arrivati al gran finale. Contro la parete di fondo c'è una torre di server neri ronzanti, che contengono circa il 10% dello sconfinato patrimonio digitale dell'Internet Archive, che comprende 835 miliardi di pagine web, 44 milioni tra libri e testi e 15 milioni di registrazioni audio, e altro ancora. Le piccole luci su ogni server si accendono e si spengono ogni volta che qualcuno apre una vecchia pagina web, consulta un libro o utilizza in altro modo i servizi dell'archivio. Questo sfarfallio costante e aritmico crea uno spettacolo di luci ipnotico. Nessuno ne è più compiaciuto di Kahle.
Non è esagerato affermare che l'archiviazione digitale, così come la conosciamo, non esisterebbe senza l'Internet Archive. Il suo progetto più famoso, la Wayback Machine, è un archivio di pagine web che funziona come una videocassetta su cui è registrato il web. L'Internet Archive è una delle più importanti organizzazioni al mondo a occuparsi di conservazione storica, la Wayback Machine è assurta al ruolo di valvola di sicurezza contro l'oblio digitale. La reputazione che si è guadagnata l'organizzazione è meritata: senza di essa, il mondo perderebbe la sua migliore risorsa pubblica sulla storia di internet.
I suoi dipendenti sono alcuni dei suoi fedeli più devoti: "à il meglio del vecchio internet ed è il meglio della vecchia San Francisco, e per molti versi nessuna delle due cose esiste più â spiega il direttore dei servizi bibliotecari Chris Freeland, un altro dipendente di lunga data, che ama il ciclismo e predilige lo smalto nero â. à una finestra sull'etica del web e sulla cultura di San Francisco della fine degli anni '90: il lato più croccante, prima che diventasse tutto regno dei tech bro. à utopico, è idealista".
I guai legali
Ma anche l'Internet Archive ha i suoi nemici. Dal 2020 è impantanato in una serie di processi. Come la causa Hachette v. Internet Archive, in cui alcuni editori hanno accusato l'organizzazione non profit di aver violato il diritto d'autore mettendo a disposizione versioni digitalizzate di libri fisici. Ma c'è anche il procedimento UMG Recordings v. Internet Archive, in cui diverse etichette musicali affermano che l'Internet Archive abbia infranto il copyright.
In entrambi i casi l'Internet Archive ha incentrato la sua difesa sulla dottrina del fair use, sostenendo di essere autorizzato a utilizzare materiali protetti da copyright in quanto ente non commerciale. Nel 2023 l'organizzazione ha vinto il primo grado della causa contro gli editori, ma recentemente ha perso in appello. L'Archivio potrebbe fare ricorso alla Corte Suprema degli Stati Uniti, ma non nell'immediato ("non abbiamo deciso", mi ha detto Kahle il giorno dopo la decisione). All'inizio di quest'anno inoltre un giudice ha respinto il tentativo di archiviare la causa avviata delle major musicali. Kahle dice che sta pensando di patteggiare, ammesso che sia un'opzione percorribile.
Il peso di questi procedimenti legali rischia di schiacciare Internet Archive. Soprattutto la causa contro le etichette discografiche potrebbe rivelarsi una minaccia esistenziale, a fronte di possibile multe da centinaia di milioni di dollari.
Internet ha affidato la sua memoria collettiva a questa istituzione idiosincratica. E ora si trova di fronte alla prospettiva di perdere tutto.
La nascita dell'Internet Archive
Kahle era ossessionato dalla creazione di una biblioteca digitale fin da giovane, una vocazione che lo ha spinto a studiare intelligenza artificiale al Mit. "Volevo costruire la biblioteca del tutto, e avevamo bisogno di computer abbastanza grandi per poterla gestire", raconta.
Dopo essersi laureato nel 1982, ha lavorato presso la Thinking Machines Corporation, una startup di supercomputing. Lì ha sviluppato un programma chiamato Wide Area Information Server (Wais), un modo per cercare dati su computer remoti. Ha lasciato l'azienda per creare una startup con lo stesso nome, che ha venduto ad Aol nel 1995. L'anno successivo, dalla sua soffitta, ha lanciato un progetto palindromo: AI e IA.
Niente a che vedere con l'intelligenza artificiale in questo caso. AI era l'acronimo di una società chiamata Alexa Internet ("Alexa" è un riferimento alla biblioteca di Alessandria). Poi c'erà IA, cioè l'Internet Archive, una società senza scopo di lucro. I due progetti erano interconnessi: Alexa Internet effettuava il crawling del web per poi donare quello che trovava all'Internet Archive. Ma Kahle non riusciva a far funzionare il modello commerciale di AI. E quando Amazon gli fece un'offerta nel 1999, accettare gli sembrò prudente. Il colosso pagò 250 milioni di dollari in azioni per acquistare Alexa, separando l'AI dall'IA e facendo di Kahle un uomo ricco.
Kahle rimase a lavorare ad Alexa per qualche anno, prima di andarsene nel 2002 per concentrarsi sull'Internet Archive. Da allora l'organizzazione è diventata la sua vocazione: "Tutto il suo essere è impegnato nell'Archivio â dice Pam Samuelson, studiosa di copyright, che conosce Kahle dagli anni '90 â. Lo vive e lo respira".
Se la Silicon Valley ha un signor Fezziwig, questo è Kahle. Non è un asceta: ha una bella barca a vela nera ancorata in uno yacht club di lusso. Ma la sua vita quotidiana è modesta. Va al lavoro in bicicletta e si veste come uno a cui non interessano i vestiti. Anche se un tempo amava il Burning Man â lui e sua moglie, Mary Austin, che ha sposato al festival nel 1992 â ora pensa che sia diventato troppo grande. Ma quello che ama davvero, e più di ogni altra cosa, è il suo lavoro.
Kahle è ora l'allegro custode di un catalogo eccezionalmente fornito, che abbraccia ogni sorta di media digitali e fisici, dai videogiochi classici alle registrazioni di concerti dal vivo, dalle riviste e dai giornali ai libri di tutto il mondo. Di recente ha fatto il backup alle istituzioni culturali dell'isola di Aruba. à uno strumento essenziale per ogni tipo di ricerca, da quella giuridica â in particolare per quanto riguarda il diritto dei brevetti â al giornalismo: "Ci sono altri strumenti di archiviazione online â dice Craig Silverman, giornalista di ProPublica â, ma nessuno di questi è paragonabile a Internet Archive".
Quello che rende unico l'Internet Archive è la sua volontà di spingersi oltre i confini in modi sconosciuti alle biblioteche tradizionali. Anche la Biblioteca del Congresso statunitense archivia il web, ma solo dopo aver avvisato i siti web che setaccia (e spesso chiedendo il permesso).
"L'Internet Archive è sempre stato un po' rischioso", afferma Ian Milligan, storico dell'Università di Waterloo. La sua utilità si intreccia con il suo vecchio approccio al copyright. Kahle e la sua organizzazione fecero causa al governo americano più di vent'anni fa, contestando il modo in cui due leggi â il Copyright Renewal Act del 1992 e il Copyright Term Extension Act del 1998 â avevano ampliato la legge sul diritto d'autore. Persero la causa, ma certo non il desiderio di continuare ad andare per la loro strada.
Una di queste spinte è arrivata nel 2005. All'epoca, il compianto hacker Aaron Swartz lavorava spesso ai progetti dell'Internet Archive e, insieme a Kahle, aveva ideato e guidato lo sviluppo di una nuova iniziativa chiamata Open Library. L'obiettivo era quello di creare una pagina web per ogni libro del mondo. Kahle vedeva il progetto come un'alternativa a Google Books, non guidata da interessi commerciali ma dall'ideale della libera informazione.
Oltre al tentativo di catalogare tutti i libri mai esistiti, il progetto punta a renderne disponibili le copie ai lettori, scannerizzando i libri fisici e poi permettendo alle persone di consultarne versioni digitalizzate. Per oltre un decennio, il progetto ha utilizzato una struttura chiamata prestito digitale controllato (CDL), in cui i libri digitalizzati sono trattati come quelli fisici e non come ebook. I libri prestati sono stati acquistati da Internet Archive o donati da altre biblioteche, organizzazioni o privati; secondo i principi del CDL, le biblioteche che possiedono una copia fisica di un libro dovrebbero essere in grado di prestarlo digitalmente.
Il progetto si rivolge principalmente ai ricercatori che hanno difficoltà a reperire libri specifici, piuttosto che ai lettori occasionali: "Provate a prendere uno dei nostri libri e poi a leggerlo: è un'impresa", dice Kahle. à la verità . Rispetto a un normale ebook su un Kindle, una scansione sfocata di un libro fisico sullo schermo di un computer è come la musica di un piccolo altoparlante iPhone paragonata a quella diffusa da un sistema audio surround Bose. La maggior parte di chi prende in prestito un libro tramite il servizio lo utilizza per meno di cinque minuti.
In genere le biblioteche che ottengono in licenza gli ebook hanno un numero limitato di prestiti; se smettono di pagare, il libro sparisce. Il CDL è un tentativo di dare alle biblioteche un maggiore controllo sul loro inventario e di ampliare l'accesso ai libri di una collezione che esistono solo come copie fisiche.
Per anni gli editori hanno ignorato le scansioni dell'Internet Archive. Ma durante la pandemia hanno cambiato approccio, dopo che l'Internet Archive aveva iniziato a prendersi troppe libertà con il CDL.
Nel marzo 2020, mentre le scuole e le biblioteche chiudevano improvvisamente, gli Archivers si sono trovati di fronte a un dilemma. La domanda di ebook superava di gran lunga la loro capacità di prestarli rispettando i restrittivi contratti di licenza, e non c'era modo di dare in prestito libri che esistevano solo in forma fisica. L'Internet Archive ha quindi preso una decisione coraggiosa, permettendo a più persone di prendere in prestito simultaneamente le versioni digitali dello stesso libro, attraverso un nuovo programma ribattezzato National Emergency Library. âAbbiamo agito su richiesta di bibliotecari, educatori e scrittori", dice Chris Freeland.
Kahle ricorda di aver pensato che l'Internet Archive avrebbe dovuto fare tutto il possibile per espandere l'accesso alle opere. Credeva di poter contare su un largo sostegno: âAbbiamo raccolto le firme di oltre 100 biblioteche che hanno detto: âAiutateciâ", spiega.
Dave Hansen, oggi direttore esecutivo dell'associazione no-profit Authors Alliance, all'epoca era un bibliotecario della Duke University. âAvevamo enormi difficoltà a procurare i libri ai nostri studenti â dice â. Quello che hanno fatto è stato in buona fede".
Non tutti però erano d'accordo. Importanti scrittori hanno criticato con veemenza il progetto, così come la Authors Guild e la National Writers Union, rispettivamente un'associazione e un sindacato degli autori americani: "Non sono una biblioteca. Le biblioteche comprano libri e rispettano il copyright. Sono dei truffatori che si atteggiano a santi", ha scritto su Twitter lo scrittore James Gleick (che oggi sostiene ancora che l'Internet Archive non sia una biblioteca, pur ammettendo che "truffatori è un po' troppo").
Lotta per la sopravvivenza
Internet Archive si è ritrovato nella sua prima vera e propria crisi di immagine pubblica. Nel giugno 2020 una coalizione di case editrici ha fatto causa all'organizzazione, accusandola di violare la legge sul copyright. Poche settimane dopo, l'Internet Archive ha cancellato la National Emergency Library ed è tornato al suo tradizionale sistema di prestiti limitati. La mossa però non ha fermato gli editori.
Le case editrici e i loro sostenitori sostengono che il comportamento dell'ente abbia danneggiato gli autori: "L'Internet Archive sostiene che sia giusto fare e distribuire a un pubblico globale copie non autorizzate dell'opera di un autore â dice a Wired Us Terrance Hart, consigliere generale dell'Associazione degli editori americani â. Immaginate se tutti iniziassero a fare lo stesso. L'unica minaccia esistenziale è quella che lâInternet Archive rappresenta per il sostentamento degli autori e per il sistema del copyright nell'era digitale".
Dopo l'avvio della causa, oltre mille scrittori (tra cui Naomi Klein e Daniel Ellsberg) hanno firmato una lettera a sostegno delle biblioteche e dell'Internet Archive. Un autore favorevole al progetto, Chuck Wendig, ha cambiato idea pubblicamente dopo aver criticato sull'allora Twitter il progetto. Anche alcuni scrittori che attualmente appartengono e sostengono la Authors Guild, come Joanne McNeil, si sono detti convinti sostenitori dell'Archivio. La scrittrice a volte legge i libri fuori catalogo utilizzando il servizio di prestito, che considera ancora uno strumento vitale. "Spero che i miei libri siano nel progetto Open Library", spiega, aggiungendo che è consapevole del fatto che i suoi libri, acclamati dalla critica ma di modesta popolarità , non sono molto diffusi. "Almeno saprò che in questo modo c'è un posto dove la gente può trovarli".
Le dimostrazioni di sostegno non hanno cambiato le cose. Nel marzo 2023, l'Internet Archive ha perso il primo grado di giudizio, e a settembre è arrivata la sconfitta in appello. Il tribunale ha respinto le argomentazioni dell'organizzazione sul fair use, sottolineando che l'Archive non ha dimostrato di non danneggiare finanziariamente gli editori. Nel frattempo, le spese legali continuano ad accumularsi.
Dopo la sentenza iniziale nella causa Hachette v. Internet Archive, le parti hanno concordato i termini di un accordo. Kahle ha confermato che l'ente riesce a sopravvivere finanziariamente grazie all'aiuto dei donatori. Se l'Internet Archive deciderà di non fare di nuovo ricorso, dovrà rispettare i termini dell'accordo. Un duro colpo, ma non il colpo di grazie.
Uscire indenni dall'altro procedimento in corso potrebbe essere molto più difficile. Nel 2023, diverse grandi case discografiche, tra cui Universal Music Group, Sony e Capitol, hanno fatto causa all'Internet Archive per il suo Great 78 Project, un archivio digitale che custodisce una collezione di registrazioni di album di nicchia in formato obsoleto noto come 78, utilizzato dal 1890 alla fine degli anni Cinquanta. La denuncia sostiene che il progetto "mina il valore della musica" e cita 2.749 violazioni del copyright, il che significa che il risarcimento potrebbe superare i 400 milioni di dollari.
Anche in questo caso la difesa si basa sul fair use. L'Internet Archive sostiene che la conservazione di versioni obsolete di questi dischi rende la storia accessibile al pubblico. La legge americana sul diritto d'autore è notoriamente imprevedibile e alcuni giudicano la strategia processuale dell'organizzazione traballante.
James Grimmelmann, professore di diritto digitale e dell'informazione alla Cornell University, ritiene che le etichette stiano "gonfiando enormemente il danno commerciale" causati dal progetto. Ma anche se ogni registrazione viene consultata in media solo una volta al mese. Grimmelmann non è convinto che questo aspetto sia importante: "Stanno riproducendo direttamente queste opere â commenta â e questo è un passaggio molto difficile per un giudice".
Potrebbero passare anni prima che il caso arrivi al dunque, il che significa che l'incertezza sul futuro di Internet Archive è destinata a persistere, e potenzialmente a diffondersi. E se il caso si risolvesse con un accordo o una vittoria per l'industria discografica, altri titolari di copyright potrebbero seguire l'esempio del settore e fare causa.
Internet senza Internet Archive?
Perdere l'Internet Archive è una prospettiva spaventosa: "C'è l'errata percezione che le cose sul web siano per sempre, ma in realtà non è così", afferma Craig Silverman, secondo il quale la scomparsa dell'organizzazione no-profit renderebbe certi studi e relazioni "molto più difficili, se non impossibili", oltre a rappresentare la perdita di un bastione della nostra memoria collettiva.
Nel frattempo, a settembre Google e l'Internet Archive hanno annunciato una partnership per consentire agli utenti di visualizzare le vecchie versioni dei siti web in Search tramite la Wayback Machine.
Ma la no-profit ha anche altri problemi oltre a quelli legali. Per cominciare, archiviare il web le cose è sempre più difficile. Come mi ha spiegato il direttore della Wayback Machine Mark Graham, l'ascesa delle applicazioni con funzioni come il livestreaming (soprattutto se limitate a determinati sistemi operativi) rappresenta una sfida tecnica. Ma anche i paywall sono un ostacolo, così come l'enorme e crescente quantità di contenuti: "C'è così tanto materiale â dice Graham â. Come si fa a sapere a cosa dare priorità ?".
E poi c'è l'intelligenza artificiale. Finora l'Internet Archive ha eluso o è stato risparmiato dai nuovi controlli sul web crawling legato alla raccolta dei dati di addestramento dell'AI. Lo scorso giugno, per esempio, quando Reddit ha annunciato l'aggiornamento della sua politica sullo scraping, la piattaforma ha specificato che ia "soggetti in buona fede" come l'Internet Archive avrebbero potuto continuare a ricorrere alla pratica.
L'ascesa dell'intelligenza artificiale ha già inasprito l'atteggiamento di alcuni creativi nei confronti dell'atteggiamento dell'Internet Archive sul copyright. Mentre Kahle vede la sua creazione come una biblioteca schierata dalla parte dei piccoli, gli oppositori contestano strenuamente questa visione. Dipingono Kahle come un lupo tecnologico travestito da bibliotecario, fermo a una mentalità più adatta all'era di Napster. L'Internet Archive sta combattendo le battaglie di 20 anni fa, quando dire "editori cattivi, tutto ciò che danneggia gli editori è buono" era semplice, dice Neil Turkewitz, un ex dirigente della Recording Industry Association of America. "Ma questo non è il mondo in cui viviamo", aggiunge.
Quando gli ho parlato su Zoom, poco dopo aver saputo che l'Internet Archive aveva perso il ricorso, Kahle è apparso agitato. Un profeta di internet che vaga nel deserto. Era appollaiato di fronte a scogliere frastagliate durante un'escursione vicino ad Arles, in Francia, con un cappellino da baseball blu tirato sui capelli, le guance arrossate dal sole e la sua solita affabilità offuscata da un senso di sconforto. Non aveva saputo in anticipo della data della sentenza, così ha interrotto la sua vacanza di una settimana: "à davvero deprimente", dice.
Mentre siede su una roccia con il telefono in mano, il fondatore della più grande biblioteca di internet dichiara che il sistema giuridico statunitense è rotto. Non pensa che l'ultima sentenza sia la fine dei processi: "Credo che il cartello del copyright stia facendo passi da gigante", dice. Ma in lui non c'è traccia di rimpianto, solo una rinnovata convinzione del fatto che quello che sta facendo sia giusto: "Abbiamo una grande opportunità . à il sogno di Internet â spiega â. E siamo noi a perderla". La sua sembra più una preghiera che una dichiarazione.
Questo articolo è comparso originariamente su Wired US.