GLAM/Biblioteche: un esempio di collaborazione tra Wikipedia e biblioteche in Italia

di Susanna Giaccai

Il giorno 5 ottobre presso la Biblioteca Marucelliana, nell’ambito di Bibliopride si è tenuto il Seminario Biblioteche e Wikipedia, condivisione Open Data e competenze.
L’articolo informa sugli obiettivi e realizzazioni del Progetto di collaborazione.

Il Progetto GLAM
Ormai tutti conoscono Wikipedia e sanno che quando fanno una ricerca con un motore di ricerca tra le prime risposte troveranno un link a Wikipedia. Ma pochi conoscono la galassia Wikipedia, i suoi diversi contenuti, le sue modalità di funzionamento. Ed anche pochi tra i bibliotecari si sono soffermati a guardare cosa c’è attorno e dietro l’enciclopedia che frequentemente consultano, eppure sarebbe di grande importanza, per migliorare la qualità delle loro attività, soprattutto il reference, che dedicassero un po’ di tempo ad approfondire la conoscenza di questo mondo. Ci viene incontro per fortuna, uno degli ultimi progetti avviati dalla Wikimedia Foundation, promotrice e sostenitrice, attraverso le donazioni ricevute, di Wikipedia. Nel 2011 la Fondazione ha avviato il progetto GLAM (Galleries, museums, libraries) volto a costruire un’alleanza tra il mondo Wikipedia e gli istituti della conoscenza. Se infatti nel mondo digitale la comunità wikipediana con 1,6 milioni di volontari ha fino ad ora creato 29,6 milioni di voci nelle sue 287 versioni linguistiche, questa comunità è però cosciente che il popolamento del web con informazioni relative ai beni culturali non può essere realizzato senza il coinvolgimento degli istituti della conoscenza: archivi, biblioteche, musei e gallerie sono infatti i luoghi tradizionalmente dedicati a conservare, organizzare e rendere fruibili i beni culturali e solo un loro diretto coinvolgimento sia nella attività di redazioni di voci che di donazione di immagini, può raggiungere l’obiettivo del libero accesso ai beni culturali. Il progetto GLAM si articola in linee di attività differenziale per archivi, biblioteche, musei. Molti interventi sono realizzati con accordi tra wikipediani e singole istituzioni; ne sono esempio la collaborazione con la Fondazione Cariplo che ha portato alla pubblicazione in Wikipedia di centinaia di immagini di opere d’arte della Fondazione stessa con relative voci descrittive, oppure la collaborazione con il Parco nazionale tecnologico e archeologico delle Colline metallifere grossetane che ha consentito sia la creazione di una ventina di voci specifiche che la pubblicazione di un centinaio di foto; attraverso i codici QR applicati sulla cartellonistica il progetto ha consentito che i visitatori, girando per il parco muniti di smartphone o tablet, possano navigare dal pannello alla voce di Wikipedia relativa agli oggetti presenti e visualizzarne le immagini correlate. Per le biblioteche un esempio di attività sono le sessioni di editazione collettiva organizzate dalla British Library per creare o migliorare la descrizione delle proprie collezioni in Wikipedia, oppure il progetto, più ampio e ben documentato, della State Library of Queensland, realizzato in collaborazione con Wikimedia Australia, volto a inserire contenuti di qualità relativi al proprio territorio coinvolgendo le biblioteche pubbliche locali. La collaborazione tra istituti della conoscenza e Wikipedia può anche realizzarsi con la donazione di immagini come nel caso degli Archives of American Arts che hanno donato a Wikipedia Commons (l’archivio di immagini libere) 256 immagini libere da diritti, immagini che sono state poi caricate e catalogate da wikipediani. Una pagina del progetto GLAM illustra i migliori progetti realizzati o in corso. Cosa è successo in Italia tra le biblioteche e Wikipedia? Scoperto questo progetto durante le mie navigazioni dentro Wikipedia, per capirne il funzionamento e la organizzazione, nel luglio scorso ho ripreso contatto con Andrea Zanni, un giovane wikipediano/bibliotecario che avevo conosciuto in occasione di 2 corsi di formazione per bibliotecari toscani su Wikipedia che avevo organizzato alla fine del 2009, e con Virginia Gentilini ed ho proposto loro di utilizzare una lista di discussione aperta allora e di fatto silenziosa, per avviare anche in Italia iniziative connesse al progetto GLAM, riflettendo collettivamente sulle possibili modalità di collaborazione delle biblioteche a Wikipedia. Andrea era tornato da pochi giorni dalla Wikimania 2012, un incontro annuale tra wikipediani per scambio di informazione sui progetti in corso nella comunità; lì aveva incontrato Max Klein, un wikipedian in Residence presso OCLC nell’ambito dei progetti volti ad indirizzare gli utenti del web verso le collezioni delle biblioteche: Max in quel momento stava studiando la possibilità del riuso dell’authority file VIAF in Wikipedia; l’obiettivo era di acquisire in Wikipedia, un’enciclopedia collaborativa fatta da volontari, i dati di autorità prodotti in ambito bibliotecario sulla base di rigide regole consolidate da molti decenni di lavoro di catalogazione delle biblioteche di diversi paesi. Una attività fortemente normalizzata del mondo delle biblioteche veniva così acquisita in un contesto molto diverso quale quello di una comunità di volontari che fin dalle sue origini si é fondata su proprie regole discusse e decise internamente, e molto gelosa di questa sua autonomia. Nel mondo degli open data Wikipedia è presente dal 2007 con il progetto DBpedia; un progetto aperto e collaborativo per l’estrazione e il riutilizzo di informazioni semanticamente strutturate da Wikipedia con l’obiettivo di renderle riutilizzabili da parte di software e applicazioni terze. La versione italiana del database, realizzata dalla Fontazione Bruno Kessler di Trento, contiene attualmente 1,5 milioni di entità, di cui circa 500.000 sono classificate secondo una ontologia. Tra queste vi sono più di 263.000 persone, 144.000 luoghi, 38.000 Album musicali, 29.000 film, collegate tra di loro da oltre 25 milioni di links. I dati di DBpedia sono tratti dagli infobox presenti in alto a destra nelle voci di Wikipedia, dai template contenenti citazioni bibliografiche, oppure dai link diretti tra numeri ISBN e OPAC locali, dai collegamenti tra categorie ecc. La grandissima quantità di dati aperti in formato RDF contenuti in DBpedia l’ha resa di fatto il nucleo centrale del mondo degli open data. La consapevolezza dei valore dei propri dati e della crescente esigenza delle loro qualificazione ha portato la Wikimedia Foundation a far proprio, nel marzo 2012, il progetto WikiData avviato dalla comunità wikipediana tedesca; l’obiettivo del progetto è la creazione di un unico archivio centralizzato collaborativo, multilingue ed editabile di dati strutturati liberi contenenti anche indicazione della relativa fonte e comune a tutte le diverse versione linguistiche di Wikipedia. Per molti versi DBpedia e WikiData in questa fase iniziale si somigliano ma sarà l’uso che ne determinerà in futuro le differenze. Wikidata infatti oltre a contenere i dati provenienti da Wikipedia è in grado di acquisire anche dati da fonti terze e, a differenza di DBpedia che nasce per offrire dati ad ambienti esterni a Wikipedia, Wikidata nasce per fornire dati univoci alle diverse versioni linguistiche di Wikipedia; per esempio il numero di abitanti di Lucca sarà inserito una sola volta in WikiData e da lì sarà recuperato nelle diverse versioni linguistiche di Wikipedia e lì sarà univocamente e periodicamente aggiornato. E’ dunque in questo contesto di importanti iniziative sul tema degli open data, che la lista di discussione bibliotecari@wikimedia.it ha ripreso vita nel settembre 2012. Il mio obiettivo era di incrementare la presenza delle biblioteche in Wikipedia creando occasione di formazione sulle norme editoriali di Wikipedia per i bibliotecari e gli utenti delle biblioteche, quello di Andrea Zanni, interessato alle problematiche di riuso degli open data, di acquisire dalle biblioteche dati di qualità per Wikipedia e quello di Virginia Gentilini di analizzare le possibilità offerte da Wikipedia nell’esplorare i nuovi compiti della biblioteca. Sul tema della collaborazione tra biblioteche e Wikipedia, in quelle settimane, erano usciti alcuni scritti su bollettini professionali e in blog ed erano passate alcune mail in AIB-CUR. Il gruppetto attorno alla lista bibliotecari@wikimedia.it si andava così allargando attraverso il coinvolgimento di altri wikipediani e bibliotecari. Ad agosto Stefano Parise mi dichiarò l’interesse dell’AIB per l’iniziativa; in lista all’inizio si discusse di come creare una versione italiana della pagine del Progetto GLAM anglofono.

Progetto Thesaurus BNCF e Wikipedia
L’attenzione dei wikipediani al progetto si alzò quando, a settembre, Anna Lucarelli, coordinatrice del gruppo di lavoro sul Thesaurus della BNCF, entrava nel gruppo e segnalava l’interesse della BNCF a condividere i propri dati aperti con Wikipedia. Il progetto del Nuovo Soggettario ha infatti dato vita ad un thesaurus contenente (a marzo 2013) 47.800 termini; tra le fonti indicate, quali supporto ai termini adottati, è presente anche Wikipedia con un link diretto dal termine e la relativa voce in Wikipedia; sembrava naturale che a fronte del link dal Thesaurus BNCF a Wikipedia, fosse costruito un reciproco link dalla voce di Wikipedia al relativo termine nel Thesaurus. Una mail nella lista del 4 dicembre 2012 poneva la questione, Anna Lucarelli interveniva per chiarirne i termini e nel giro di qualche settimana di intensi scambi tra wikipediani e bibliotecari e di discussioni all’interno di Wikipedia a metà maggio, incrociandosi con le attività dei wikipediani legate al progetto WikiData, il progetto era realizzato creando un template che consente la navigazione dalla voce in Wikipedia al relativo termine nel Thesaurus. Un passo successivo è in corso di analisi: si tratta di visualizzare nelle voci di Wikipedia non solo il termine relativo del Thesaurus, ma anche i suoi termini sovraordinati (BT), sottoordinati (NT) e correlati (RT), offrendo così agli utenti di Wikipedia una navigazione tra le voci dell’enciclopedia, strutturata semanticamente in modo corretto. Le categorie assegnate dai wikipediani alle varie voci sono infatti tra di loro collegate con criteri molto ampi creando a volte relazioni sovrabbondanti e spesso incoerenti dal punto di vista semantico. Non per caso si trovano frequentemente nelle pagine di discussione di Wikipedia inviti a “fare ordine” nell’organizzazione delle voci, ma nonostante questi inviti, la struttura teoricamente gerarchica delle categorie lascia molto a desiderare dal punto di vista della classificazione consueta nel mondo delle biblioteche. Ma certamente non è né possibile né auspicable irregimentare dentro una classificazione rigida Wikipedia; il tentativo avviato con il progetto Thesaurus BNCF mira invece ad affiancare alla gerarchia da loro autonomamente creata una altra gerarchia più strutturata, offrendo così all’utente 2 possibilità di navigazione tra le voci.

Progetto VIAF
Paralleramente nel gruppo Bibliotecari@wikimedia.it é partito anche il progetto di collegamento tra le voci biografiche della versione linguistica italiana di Wikipedia e il relativo nome nell’authority file del progetto VIAF. Il progetto VIAF, promosso dalla Library of Congress e dalla Deutsche Nationalbibliothek ed ospitato da OCLC, cui partecipa anche l’ICCU, ha creato un archivio che cumula i record di autorità dei principali cataloghi nazionali del mondo creando un reticolo di riferimenti tra le diverse forme del nome adottate nei vari paesi per consentire così all’utente la ricerca del nome nella forma usata dal catalogo della lingua preferita. La discussione su questo tema è stata piuttosto complessa sia per l’esigenza di farne comprendere ai wikipediani tutti i suoi aspetti, sia per la struttura dei dati di authority dell’ICCU; ne abbiamo iniziato a parlare in lista a fine dicembre e contemporaneamente in Wikipedia nella Caffetteria della biblioteca, il nome dell’area di discussione del Progetto:Bibliografia e fonti, area in cui i wikipediani discutono le tematiche connesse alla citazione di libri, bibliografie ecc. In lista interventi di Pierfranco Minsenti e Carlo Bianchini ed altri, sono serviti a chiarire a wikipediani le problematicità dell’archivio di authority file dell’ICCU mentre in Wikipedia il 24 dicembre 2012 Andrea Zanni ha presentato alla comunità il progetto. Nella Wikipedia inglese questo collegamento era già in corso di realizzazione facilitato dalla struttura degli authority file della Library of Congress. In Italia invece la questione ha presentato difficoltà per la qualità del database autori dell’ICCU non totalmente compatibile con i formati usati nell’archivio VIAF; tale problematicità è stata illustrata da Pier Franco Minsenti al seminario AIB Rilanciare il Servizio Bibliotecario Nazionale (SBN) tenutosi il 20 giugno 2013 a Roma. Dopo una iniziale comparsa del link a VIAF nel marzo 2013, è stato poi nascosto in attesa di chiarimenti tra i wikipediani e riattivato verso maggio con il template {{Controllo_di_autorità}} che produce un link, collocato in alto a destra della voce, verso gli archivi VIAF, Library of Congress e ICCU. Si tratta di un importante risultato nell’ambito dei progetti tesi alla condivisione dei dati e di quelli tesi a “portare gli utenti da Wikipedia alle biblioteche”, tuttavia ne andrà migliorata l’amichevolezza poiché il passaggio dalla voce biografica di Wikipedia al record bibliografico nei cataloghi italiani è piuttosto macchinoso. Nella versione inglese invece il link verso l’authority file di WorldCat o della Bibliotheque national de France, porta in modo amichevole velocemente ai record dei relativi OPAC. Dopo il seminario AIB si sono intensificati i contatti tra la Biblioteca nazionale di Firenze, l’Istituto centrale per il catalogo unico (ICCU) e un gruppo di wikipediani (Andrea Zanni, Cristian Cantoro (Cristian Consonni) e Sannita (Luca Martinelli)). E’ attualmente alla firma una convenzione tra la BNCF e Wikimedia Italia per approfondire la collaborazione sul Thesaurus, estenderla ad altri database della BNCF i cui metadati possano essere usati da WikiData, organizzare corsi su Wikipedia ecc. L’ICCU ha coinvolto il wikipediano Sannita nell’analisi delle procedure per caricare in WikiData l’authority file italiano operando contemporaneamente un confronto con i dati presenti in VIAF. Minore interesse ha trovato per ora in Italia il progetto Forwart to libraries lanciato nel marzo scorso dal bibliotecario americano John Mark Ockerbloom. Si tratta della costruzione di una modalità di connessione veloce dalle voci di Wikipedia agli OPAC delle biblioteche costruito utilizzando gli archivi di autorità aperti della Library of Congress e liste di OPAC preselezionali, ma per ora apparentemente poco realizzabile in Italia.

Formazione

Parallelamente alle attività di condivisione di dati aperti si è svolta anche una attività di formazione rivolta a bibliotecari ed utenti di biblioteche realizzata da me e da Virginia Gentilini, affiancate da wikipediani; oltre ad interventi in singole biblioteche, c’è stato un corso organizzato dalla Sezione Trentina dell’AIB a Cles ed una serie di 4 corsi promossi dalla Sezione AIB Toscana nel periodo giugno – settembre 2013. I risultati di questa attività sono per ora lenti da vedere: le biblioteche sia pure interessate a Wikipedia stentano a acquisire la consapevolezza necessaria per porre la collaborazione con Wikipedia ad un elevato livello di priorità nelle proprie attività. Non ancora percepita è la capacità di Wikipedia di ampliare l’accesso alle proprie collezioni speciali, alle proprie riviste digitali, ai propri fondi fotografici o iconografici se si scrivono voci su di essi, inseriscono citazioni in voci affini oppure se si donano a Wikimedia Commons immagini in proprio possesso per renderle condivisibili e riusabili da tutti. D’altra parte sarebbe dovere dei bibliotecari, in quanto professionisti, collaborare alla redazione in Wikipedia delle voci relative alla biblioteconomia e scienze affini; tali voci infatti nella versione italiana sono poche e generalmente di bassa qualità. Vi sono alcuni tentativi, per ora limitati, di avviare un Progetto biblioteche finalizzato a coordinare in Wikipedia un intervento organico di creazione, modifica, ampliamento di voci in questo settore. La redazione di voci di biblioteconomia potrebbe essere un utile ambito di intervento delle cattedre di biblioteconomia presenti in Italia; negli USA e in Canada sono già da tempo avviati progetti in questo ambito; in Italia un piccolo progetto di redazione voci da parte degli allievi con la cooperazione di wikipediani è stato fatto da Anna Maria Tammaro all’Università di Parma e in autunno partirà una sperimentazione all’Università di Firenze con la cattedra di Biblioteconomia di Mauro Guerrini. Diverse sono le inziative formative avviate da Wikimedia Italia, l’associazione che promuove Wikipedia e l’open access in Italia, per le scuole cui le biblioteche potrebbero utilmente affiancarsi. Segnalo l’interessante progetto “Adotta una parola” realizzato nell’anno scolastico 2011-2012 in collaborazione con APT Servizi Emilia Romagna e l’Ufficio scolastico regionale dell’Emilia Romagna. Le biblioteche pubbliche realizzano tradizionalmente molte attività rivolte al mondo della scuola e quindi con facilità potrebbero inserire al loro interno interventi su Wikipedia offrendo ai ragazzi un’importante occasione per apprendere un uso corretto delle fonti e dei metodi di ricerca ed anche avvicinarli ad un uso del web attivo e critico. La redazione di una voce implica infatti sia l’uso di una lingua corretta e fluida che la indicazione delle fonti da cui sono tratte le informazioni in essa contenute, in questo modo lo studente impara sia l’uso corretto della lingua che a documentare quanto scrive ricercando le fonti nel patrimonio della biblioteca.

Riferimenti:
Andrea Zanni, Le biblioteche e l’universo di Wikipedia , AIB notizie, n. 2 (2012).
Susanna Giaccai, La biblioteca in Wikipedia , AIB notizie, n, 3 (2012).
Virginia Gentilini (2012), Librarians are Wikipedian Too , Bibliotime, n. 3.
Giovanni Bergamin e Anna Lucarelli, Il Nuovo soggettario come servizio per il mondo dei linked data, JLIS, 2012, n. 1