E’ 44-75 giorni l’aspettativa di vita di una pagina Web e circa il 10 % dei siti sono persi o sostituiti da nuovo materiale ogni 6 mesi. Muovendo da questi dati e considerando che spesso le informazioni e i contenuti disponibili online hanno alto ed esclusivo valore documentario la British Library ha dato vita a un data-base che dovrebbe salvaguardare i contenuti delle pagine web britanniche.
British Library sfida l’oblio digitale. L’archivio della British Library che è tenuto a conservare una copia di tutti i libri, i quotidiani e i periodici editi in Inghilterra e Irlanda, ha ampliato il raggio di salvaguardia anche alla Rete. Alcuni dei contenuti delle pagine web in disuso o potenzialmente prossime al “buco nero” hanno un valore inestimabile nella memoria, non solo digitale di una nazione. Basti pensare alle pagine Web che hanno riferito-commentato dell’ attacco terroristico del 7 luglio 2005.
Alcune curiosità. Quanto pesa il passato di internet del Regno Unito? Il totale delle pagine ad oggi preservate è di poco superiore ai 5 Terabyte, circa 8000 cd-rom. Meno di 2000 dvd. Le pagine preservate dall’oblio devono rispondere ad alcuni criteri: “…reflect the diversity of lives, interests and activities throughout the UK, or demonstrate web innovation. They are chosen to represent a range of social, political, cultural, religious, scientific or economic activities”. L’opera di catalogazione è iniziata nel 2004 ed inoltre particolarmente interessante è l’interattività del Web archive della British Library: un’apposita sezione, celata dietro all’efficace definizione di “Nominate a Site” chiede ai visitatori di proporre i domini ritenuti interessanti per l’archiviazione.
Federica Formiga, docente di Biblioteconomia e bibliografia dell'Università di Verona ha commentato per i lettori di Univrmagazine l’iniziativa della British Library. Di seguito riportiamo i punti salienti:
Il deposito legale vale anche per i contenuti del Web. L’archiviazione dei siti Web in Inghilterra ad opera della British Library riporta alla memoria l’origine dell’istituto del “Deposito legale” che risale al 1537, quando un editto di Francesco I stabilì che nessun libro poteva essere messo in circolazione se prima un esemplare non fosse stato preventivamente depositato nella biblioteca del castello di Blois. Il ruolo del deposito legale viene delegato alle biblioteche nazionali di ogni Paese e, come si legge nelle Guidelines for legal deposit legislation non cambia con l’avvento delle pubblicazioni elettroniche. Con il Web però le dimensioni di questo ruolo cambiano. E se Google indicizza oltre tre miliardi di pagine e pare si tratti solo del Web di superficie, cioè quello indicizzato dai motori di ricerca (quello profondo risulterebbe essere più grande da 400 a 500 volte), cosa potrebbe fare una Biblioteca Nazionale centrale, italiana o inglese che sia? Senza contare che è assai difficile definire il concetto di Nazione nel contesto di risorse digitali in rete.
Alla base del Web archiving sussiste il concetto di selezione. Selezione e “utilità” delle risorse digitali, senza contare il fatto che tutto ciò che “utile” può essere definito non sempre è archiviabile. Esistono anche per il materiale pubblicamente disponibile sul web dei problemi di copyright e inoltre non tutto è archiviabile. Internet Archive per esempio non fa l’harvesting di siti Web se questi non desiderano essere archiviati o cancellano dal proprio archivio il sito già raccolto se è il suo proprietario a richiederlo.
E in Italia. Nel 2003 è stato avviato un progetto di cooperazione internazionale tra Internet Archive, Library of Congress, British Library, Bibliothèque National de France, Biblioteche nazionali dei Paesi del Nord Europa associate e della Biblioteca Nazionale Centrale di Firenze con lo scopo di sviluppare un crawler in grado di procedere ad uno sviluppo del Web Archive. Perché archiviare il web significa trovare risposte a problematiche non solo di tipo culturale, ma anche a questioni di responsabilità della conservazione certificandone i contenuti; di tecnologia non solo per raccogliere le pagine, ma anche per catalogarle, renderle disponibili garantendo non solo l’autenticità, ma anche la certezza della data.