Vedianche
- Notiziario della Sezione Ligure dell'Associazione Italiana
Biblioteche
Numero 2 Vol. 23 Anno 2013 ISSN 2281-0617
Il catalogo delle biblioteche
dell'Università di Genova in Worldcat
Antonio
Scolari
Nel mese di ottobre
è stato completato il riversamento dei dati del catalogo
delle biblioteche dell'Ateneo su WorldCat (http://www.worldcat.org/),
l'OPAC di accesso ai dati del maggiore catalogo cooperativo
internazionale, a cui partecipano biblioteche di tutto il mondo,
gestito da OCLC. Il catalogo cooperativo di OCLC contiene attualmente
oltre 273 milioni di record catalografici a cui corrispondono circa 2
miliardi di copie possedute da 72.000 biblioteche di svariati paesi.
Partecipano al catalogo le principali biblioteche di ricerca delle
università statunitensi ed europee, 44 biblioteche nazionali
e importanti biblioteche pubbliche. Il catalogo iniziato nel 1971 come
uno strumento di cooperazione statunitense, nel corso degli anni ha
assunto un carattere sempre più internazionale: oggi nel
catalogo sono comprese pubblicazioni di 470 lingue diverse, mentre
oltre il 60% dei record catalogati appartiene a lingue diverse
dall'inglese [1].
L'iniziativa, attuata dal Centro di Servizi per il coordinamento del
Sistema Bibliotecario di Ateneo, fa parte di un progetto del Consorzio
di Sistemi Bibliotecari di Ateneo CIPE (http://www.unicipe.it),
di cui l'Università di Genova è membro
fondatore. Attualmente sono stati caricati nel catalogo OCLC i record
bibliografici delle università di Genova e Siena e nei
prossimi mesi si aggiungeranno quelli degli altri nove atenei membri
del consorzio CIPE (Bologna, Firenze, Modena e Reggio, Padova, Parma,
Pisa, Politecnica delle Marche, Sassari, Venezia - Cà
Foscari). Si prevede che l'insieme dei dati catalografici degli undici
atenei del Consorzio arricchisca il catalogo internazionale di oltre 10
milioni di localizzazioni di libri, offrendo quindi una significativa
rappresentazione della ricchezza del materiale bibliografico posseduto
dalle biblioteche universitarie del nostro paese.
La partecipazione a WordCat è una delle iniziative di
apertura e condivisione del catalogo perseguite dal Sistema
Bibliotecario di Ateneo e va ad affiancarsi alla recente apertura del
Polo SBN "SGE", in collaborazione con il Sistema bibliotecario urbano.
Una prima ricaduta riguarda il catalogo dell'Ateneo: pur se strutturato
in Unimarc, al momento di estrarre le registrazioni per il loro
riutilizzo in un altro catalogo, si è resa necessaria una
revisione assai estesa soprattutto per quanto riguarda aspetti che,
lavorando a livello locale, vengono normalmente sottovalutati, ma che
in un catalogo cooperativo, specie se di tipo internazionale, sono
considerati come elementi di base per il caricamento dei record
derivati da cataloghi esterni. Inoltre il catalogo dell'Ateneo nella
sua parte meno recente è frutto di un passaggio, effettuato
alla fine degli anni '90, dal vecchio sistema Aleph che utilizzava un
formato proprietario dei record bibliografici all'attuale Aleph500 che,
per le istallazioni italiane, utilizza il formato Unimarc.
Ciò ha comportato nel corso del progetto una speciale
revisione dedicata a questi record, che in molti casi presentavano un
tracciato MARC non completamente conforme.
A seguito dell'invio ad OCLC nel novembre 2012 di un primo lotto di
prova di circa 80.000 record in formato ISO 2709, sono state
riscontrate numerose problematiche ricorrenti nei record di
campionatura inviati, in particolare in dati ritenuti da OCLC
obbligatori al fine del caricamento dei record. Così, ad
esempio, è stato necessario intervenire sull'etichetta 100
(Dati di elaborazione) per aumentare la coerenza tra il tipo di data
indicato in posizione 8 e le date registrate nelle seguenti posizioni;
nell'etichetta 101 (Lingua della pubblicazione) figuravano codici di
lingua non corretti rispetto agli standard normalmente utilizzati; o
ancora un gran numero di record era privo dell'etichetta 102 (Paese di
pubblicazione), un dato invece obbligatorio in WorldCat, come del resto
anche in SBN. In quest'ultimo caso è stato necessario
predisporre una procedura che ha consentito, non senza intervento
manuale, di aggiungere o correggere il campo in oltre 300.000 record
del catalogo.
Simile, ma affrontato in modo differente, il caso del campo 801 (Fonte
di provenienza del record), che nel nostro catalogo non presenta
contenuti costantemente omogenei, in particolare per quanto concerne
l'indicazione dell'ente responsabile della creazione o modifica del
record. Per rispondere in modo adeguato alla richiesta di OCLC di una
totale uniformità di contenuti del campo in tutti i record
inviati, si è deciso di richiedere la codifica dell'Ateneo
nella MARC Code List
for Organizations, la lista internazionale delle
biblioteche e dei sistemi bibliotecari gestita dalla Library of
Congress [2], che rilascia i codici
alle istituzioni non solo statunitensi, per l'uso all'interno dei
record MARC per progetti di cooperazione nazionali e internazionali.
L'Ateneo è quindi stato codificato con la sigla "IT-GeUSG"
(in forma normalizzata: "itgeusg") e tale sigla è stata
inserita nel sottocampo $b dei record esportati. In questo caso non si
è intervenuti direttamente nei record, ma si è
impostata una procedura di esportazione che sostituisce i campi 801 dei
record e ne crea uno specifico ed identico per tutti i record solo al
momento della creazione dei file da inviare a OCLC, senza operare
modifiche nel database locale.
Il miglioramento del catalogo non ha riguardato solo questi aspetti in
parte "formali" del MARC, ma su segnalazione di OCLC si è
intervenuti anche su problemi di maggiore importanza dal punto di
vista della correttezza dei dati. Così, ad esempio, sono
state riviste alcune centinaia di titoli erroneamente privi del
sottocampo $a e quindi introvabili nel catalogo; sono stati corretti i
delimitatori di articolo nei campi titolo (200. 500, 454, ecc.) in un
alto numero di casi; sono stati sanati in svariati campi sottocampi
erronei; si è intervenuti in moltissimi record descritti a
più livelli per i quali non erano coerenti i dati di legame;
si sono arricchiti record bibliografici - soprattutto di opuscoli o
estratti - che risultavano troppo lacunosi per una loro corretta
identificazione. Questi ultimi tipi di revisioni hanno aumentato la
coerenza del catalogo e quindi hanno anche portato a un complessivo
miglioramento della qualità del catalogo per gli utenti
dell'OPAC locale.
Le revisioni sul catalogo sono state effettuate nella primo semestre
del 2013, mentre nel contempo venivano predisposte le procedure per
l'estrazione dei dati e per effettuare alcune elaborazioni sui dati al
momento dell'estrazione. È il caso, ad esempio, della
eliminazione di campi proprietari sia di tipi numerico che di tipo
alfabetico, utilizzati per diversi scopi nel catalogo, ma che non
dovevano essere trasmessi nell'esportazione finale. È stato
possibile predisporre queste procedure grazie alla
disponibilità in Aleph di un linguaggio interno che permette
la creazione di routine
da applicare ai record bibliografici e manipolarne in modo adeguato il
contenuto, senza l'intervento da parte dell'azienda che produce il
software.
Sono stati esclusi dall'esportazione tutti i record che erano privi di
copia, per l'impossibilità da parte di OCLC di localizzarli
è il caso degli spogli, di risorse elettroniche remote e di
record appartenenti a catalogazioni a più livelli; sono
stati inoltre escluse pubblicazioni che risultavano in acquisizione al
momento dell'estrazione finale.
Nel mese di luglio sono stati depositati sul server olandese di OCLC i
dati esportati, in formato ISO2709, nella loro versione finale; i file
sono stati processati dalla sede americana nel corso dell'estate, per
giungere - non senza qualche ritardo - al loro definitivo caricamento
in WorldCat nel corso del mese di ottobre.
OCLC ha processato 559.437 registrazioni bibliografiche, che
rappresentavano, alla data dell'estrazione, i record bibliografici con
almeno una copia appartenente a una delle biblioteche dell'Ateneo; il
totale dei record bibliografici dotati di copie in catalogo ammontava,
alla medesima data, a 802.545, conteggiando anche quelli che
riportavano almeno una copia appartenente a una delle biblioteche
civiche. Sono stati rifiutati dalle procedure di importazione 833
record, che contenevano errori non sanabili. Infine sono state create
667.229 copie riferite alle biblioteche dell'Ateneo. Sono stati creati
in WorldCat 365.465 nuovi record: l'alto numero di nuove creazioni si
spiega in parte con il fatto che finora nel catalogo non sono
moltissimi i record con lingua di pubblicazione "ita" (circa 6,3
milioni prima del caricamento di Genova) e che sono relativamente
scarsi i record con lingua di catalogazione "ita" (circa 1.4 milioni
prima del caricamento di Genova). Tuttavia l'impressione è
che la deduplicazione automatica, pur basata su algoritmi avanzati, sia
ancora non completamente efficace e che quindi un certo numero di
record «nuovi» rappresentino in realtà
delle duplicazioni di registrazioni già esistenti nel
catalogo.
A valle dell'importazione OCLC ha rilasciato all'ateneo l'elenco degli
"OCL numbers", gli identificativi univoci, attributi ai record di
Genova in WorldCat, che sono stati importati nel catalogo nel campo
035, in modo che sia possibile identificare in modo univoco i record
del nostro catalogo in quello cooperativo. Sarà
così possibile procedere a future manutenzioni e,
soprattutto, tra breve verrà creato un link diretto fra i
record WorldCat e il nostro Opac locale a cui verranno reindirizzati
gli utenti di WorldCat.
Il nuovi record via via catalogati dalle biblioteche dell'ateneo
verranno inviati a OCLC con cadenza trimestrale, per garantire un
ragionevole aggiornamento dei dati nel catalogo internazionale.
Fin qui i risultati e le ricadute per così dire
«interne» del progetto, che però, in
considerazione della sua valenza consortile, ha ricadute
«esterne» di non minore importanza.
Una prima ricaduta è la visibilità del posseduto
di un significativo numero di biblioteche di università
italiane nel maggiore catalogo internazionale, a cui gli utenti
accedono non solo direttamente, ma anche tramite il collegamento
esistente fra Google Books e WorldCat. Nelle poche settimane intercorse
dal caricamento dei record sono già giunte a nostre
biblioteche richieste di document delivery da biblioteche europee e
statunitensi, a riprova della vasta diffusione di WorldCat come
strumento per il prestito interbibliotecario.
Più in generale il progetto del consorzio ha lo scopo di
colmare una grave lacuna di rappresentazione del posseduto dalle
biblioteche italiane nel catalogo di OCLC. Infatti finora la presenza
di biblioteche italiane nel catalogo internazionale era assai limitato,
al punto che un utente italiano di WorldCat trovava la
disponibilità di libri editi in Italia o di importanti
autori italiani non in biblioteche italiane, ma soltanto in biblioteche
straniere.
Infine è recentissimo l'annuncio di un accordo tra OCLC e
Plum Analytics per avviare l'utilizzo di WorldCat per il calcolo di
indici bibliometrici per la valutazione dell'impatto dei lavori
scientifici dei ricercatori, tramite il prestito interbibliotecario. La notizia è assai interessante,
perché potrebbe diventare una via per valorizzare nelle analisi bibliometriche applicate
ai prodotti della ricerca il peso delle monografie, un aspetto della
massima importanza per i ricercatori delle aree disciplinari
umanistiche e sociali, spesso non coperte dai sistemi di calcolo
bibliometrico tradizionali, limitati come sono ai periodici. La
presenza nel catalogo internazionale di una parte rappresentativa delle
pubblicazioni scientifiche in lingua italiana o edite in Italia
è di sicuro un veicolo importante per aumentarne la
diffusione e l'uso.
Il progetto di CIPE ha poi favorito la traduzione in italiano
dell'interfaccia di consultazione di WorldCat, che da qualche mese
è disponibile per gli utenti dall'Italia e si affianca alle
numerose versioni in varie lingue in cui l'interfaccia è
stata tradotta.
A seguito dell'iniziativa del Consorzio CIPE, anche altri atenei
italiani stanno per riversare i propri dati in WordCat, fra questi
l'Università Cattolica.
NOTE
[1] I dati sono tratti da OCLC
Annual Report 2011-2012, il più recente dei
report annuali, disponibile all'indirizzo http://www.oclc.org/content/dam/oclc/publications/AnnualReports/2012/2012.pdf
e dalla pagina WorldCat
facts and statistics http://www.oclc.org/en-
europe/worldcat/catalog.html
[2] Si veda: http://www.loc.gov/marc/organizations