firenze, 18 ottobre 2016 - piattaforma moodle · bibframe-bibliographic framework as a web of data:...
TRANSCRIPT
SBN: un bilancio per il futuroFirenze, 18 ottobre 2016
Great tradition
linked data e SBN
Il futuro che c’è già
di Mauro GuerriniUniversità di Firenze
2
Sommario
Filone teorico: FRBR come modello concettuale e riflessione teorica
alla base di tutti i progetti realizzati dal 2000 a oggi.
Linked data come tecnologia di supporto.
Proposte per un nuovo SBN: muoversi nell’alveo di riferimento
europeo e internazionale e apportare il nostro contributo.
3
Michael Gorman ha parlato di Great Tradition citando le
tappe che hanno testimoniato i punti più alti
dell’eleborazione teorica nel settore della catalogazione;
lo fece nel messaggio rivolto a Seymour Lubetzky in
occasione del festeggiamento dei cento anni dell’illustre
bibliotecario, tenuto all’UCLA il 18 aprile 1998
Saggio edito in traduzione italiana in “Biblioteche oggi”, vol. 18, n. 6 (luglio-Agosto
2000), p. 6-11.
Alla fine degli anni Ottanta del secolo scorso molti
cominciano a denunciare la necessità di una revisione
dei Principi di Parigi del 1961
ICP
2009e aggiornamenti
FRBR
1998e aggiornamenti
La Great Tradition – Filone teorico: FRBR e ICP
L’era digitale
Il baricentro dell’universo della conoscenza
registrata è andato spostandosi dalle collezioni
possedute da biblioteche, archivi e musei alle
collezioni accessibili nel web, con una loro
espansione amplissima e rapidissima, seguita –
o sollecitata – da milioni di persone.
Dato di fatto:
Alcune importanti biblioteche, soprattutto europee e
nordamericane (dal 2004 circa) stanno sperimentando
l’applicazione delle tecnologie dei linked data per la
pubblicazione e l’utilizzo dei propri dati sul web.
6
Filone applicativo: le biblioteche nel web semantico
Le biblioteche nel web semantico: On the record - 2008
Necessità del cambiamento affinché i dati del catalogo siano
del web e non solo nel web: frase formulata in varie forme e
occasioni, la più significativa delle quali è On the record, il
report della Library of Congress Working Group on the Future of
Bibliographic Control, del 2008; frase ripresa e resa famosa da
Karen Coyle.
https://www.loc.gov/bibliographic-future/news/lcwg-ontherecord-jan08-final.pdf
Si richiama alla necessità di:
trasformare la descrizione testuale in set di dati (dataset)
usabili per processi ed elaborazioni automatiche da parte di
macchine;
rendere gli elementi di dati univocamente identificabili (URI);
assicurare la compatibilità dei dati con le tecnologie e gli
standard del web;
usare un linguaggio trasversale e interoperabile nella realtà
del web.
Le biblioteche nel web semantico: On the record
Nuovi modelli catalografici e linked data
Adozione delle logiche e delle tecnologie del web semantico nel contesto
delle biblioteche:
•ripensamento profondo del modello del catalogo finora conosciuto
(matanoia);
•rifondazione dei principi, degli standard e delle normative
catalografiche.
RDA: (implementato il 31 marzo 2013) standard per la metadatazione delle
risorse nell’era digitale => non codice di regole, ma linee guida che si
muovono all’interno della filosofia del web semantico e dei linked data.
Nuovi modelli catalografici e linked data
«MARC must die!»
Il formato piatto (testuale) del record MARC è ritenuto inadeguato a
esprimere le relazioni tra entità bibliografiche che il modello FRBR
considera fondamentali.
Affermare che MARC è morto è una provocazione: l’accento è da porsi
sul riuso, la reinterpretazione, a partire dal progetto BIBFRAME, che
pone in evidenza l’esigenza di riutilizzare – reinterpretandoli – i milioni
di dati già presenti nei cataloghi.
Nuovi modelli catalografici e linked data
BIBFRAME - Bibliographic Framework as a
Web of Data: Linked Data Model and
Supporting Services
Primo modello BIBFRAME (2012)
Il progetto Bibliographic framework
initiative (BIBFRAME) della Library of
Congress propone un modello del tipo
entità-relazione il cui scopo è la transizione
degli standard di catalogazione
all’ambiente dei linked data, per rendere le
informazioni bibliografiche più utilizzabili
all’interno e all’esterno della comunità
bibliotecaria.
BIBFRAME – Modello dati versione 2.0 (aprile 2016)
BIBFRAME riprende FRBR e
propone un modello
semplificato:
Work = Opera
Instance = Istanza
Item
Nuovi modelli catalografici e linked data
L’adozione di FRBR implica il passaggio
dal record management al data management
Il record testuale, da rigido, statico, si trasforma in un dataset, in
un insieme di dati, ciascuno identificato e descritto tramite
metadati di qualità, specifici, comprensibili per l’utente e
preparati per l’uso (cfr. International Open Data Conference,
Madrid, ottobre 2016: IODC16).
Nuovi modelli catalografici e linked data
Il dato è, così, un elemento autonomo, auto-consistente,
usabile (e riusabile) in contesti differenti e in
rappresentazioni differenti.
Non si ha più la redazione di un record, bensì la
definizione dei dati (relativi a un’opera, a un autore,
etc.) formulati tramite termini estratti da vocabolari
controllati e da ontologie.
Importanza delle relazioni
Il procedimento d’identificazione aumenta la granularità deidati che servono a identificare le entità, ma non a chiarire lerelazioni che intercorrono tra di esse.
Questo è il motivo per cui collegare le entità è oggi unobiettivo centrale: linkare (linked data), connettere le entitàsulla base di relazioni concettuali e funzionali.
Sono le relazioni che permettono di navigare tra entità, trametadati di tipo e origine diversa, funzione concepita da ElaineSvenonius in The intellectual foundation of internationalorganization, Cambridge, Mass., The MIT Press, 2000.
Lo sviluppo di OPAC sempre più avanzati consente di interrogare più
banche dati e di ricostruire, idealmente la Famiglia di opere
Navigare
Occorre procedere nella direzione di:
rendere ricercabili in un unico sistema di consultazione le
varie tipologie di risorsa possedute o ritenute rilevanti;
integrare i vari oggetti digitali coinvolti (per esempio, libro,
videoconferenza sul libro edita su YouTube, le varie fonti
correlate, i commentari, le recensioni, etc.
Esempio (che segue) di data.bnf.fr
Resource Description and Access
Identificare – Collegare – Presentare – Scoprire
18
Identificare e collegare
Alexandre Dumas
Presentare Scoprire
FRBR base comune dei progetti europei
FRBR
data.bnf.fr
bnb.data.bl.uk
dnb.de.dataservice
datos.bne.es
Nuove sfide
Arricchire BNB linked open data con collegamenti ad altre
risorse (sono in valutazione ISNI, LC/NACO e Dbpedia).
Valutazione di collegamenti di maggiore granularità relativi ai
luoghi (rendere possibile una mappatura esatta tra Geonames
e i luoghi di pubblicazione).
Collegamento di BNB come linked open data con altre
bibliografie nazionali (sperimentazione con le risorse
bibliografiche della Deutsche Nationalbibliothek).
I linked data ... una realtà
http://libris.kb.se/A partire dal 2011 la Bibliografia Nazionale e l’Authority
file svedese, due sottoinsiemi del database LIBRIS,
hanno messo a disposizione i loro dati in formato RDF.
I linked data….una realtà
«In questo modo chiunque può vedere, valutare, fare riferimento e in ultima
analisi, contribuire al lavoro svolto dalla Biblioteca Nazionale [svedese]. Ciò
implica che la visibilità e l’apertura conduce a una maggiore qualità dei dati
[…]. Chiunque può ottenere le modifiche apportate all’Authority file entro
pochi secondi dal cambiamento. Quanto appena descritto va visto come un
investimento strategico nella direzione dell’apertura e la conclusione logica
dell’idea cooperativa […].
Questa, in sintesi, la promessa dei linked data, e cioè che si può distribuire la
creazione dell’informazione senza doverla costantemente aggregare per
renderla utile».
(Malmsten, M. (2013). Cataloguing in the open-the disintegration and
distribution of the record. JLIS. it, 4 (1), 417).
Un progetto per SBN Perché una versione
data.sbn.it?
- Necessità di descrivere la produzione digitale (e-
books, etc.)
- Necessità di avere numerosi partner che partecipano
alla realizzazione di “catalogo” rinnovato; per
esempio, Wikipedia e gli enti coinvolti nella
redazione della nuova BNI annunciata poche
settimane fa.
Un progetto per SBN Perché una versione data.sbn.it?
Alcune proposte di lavoro, su cui riflettere e lavorare insieme.
- Necessità di una vision che definisca una programmazione a lungo termine anziché interventi episodici dettati dalle mode.
- Necessità di usare il medesimo linguaggio internazionale (linked data) per poter parlare col resto del mondo dell'informazione e delle biblioteche.
- Raccordo di SBN con le iniziative di ItaliaDigitale
- Necessità che l’Italia sia all’interno dei circuiti internazionali
- SBN dovrebbe usare la consapevolezza del proprio ruolo e la
ricchezza dei propri dati per essere sempre più aperta
alla molteplicità delle realtà presenti sulla rete.
- Nel suo ruolo di servizio bibliotecario nazionale SBN
dovrebbe perseguire la missione di mettere a
disposizione della comunità italiana e internazionale i
dati bibliografici prodotti, come fanno le principali
Biblioteche Nazionali europee.
Un progetto per SBN: perché una versione data.sbn.it?
Un progetto per SBN: perché una versione data.sbn.it?
- Necessità di creare un nuovo modello di Indice SBN che
utilizzi la tecnologia linked data in modo conforme ai principi
e alle finalità del web semantico.
Dati visibili, disponibili e liberamente utilizzabili nel web.
L’applicazione dei linked data consente di integrare i dati bibliografici
per la ricerca web rispondendo così alle aspettative di chi opera in
ambiente digitale (dati del web e non solo nel web).
Le biblioteche non possono ignorare la loro scarsa rilevanza sul
web, dove i loro cataloghi non sono integrati e ricercabili
L’universo bibliografico cresce a un ritmo che rende
complesso attingere a tutte le informazioni disponibili
Un progetto per SBN: perché una versione data.sbn.it?
Un progetto per SBN: importanza dell’autority control
Applicazione del modello FRBR per identificare univocamente le entità
per poi procedere a creare le relazioni e i link
Importanza del lavoro di authority control
SBN è stato un precursore con l’uso del VID (Vedette Identifier), un
identificatore univoco della forma dell’autore
Un progetto per SBN: importanza dell’autority control
• Authority control per tutte le entità: opera, persone, enti, etc.
• Identificazione e authority per le entità Opera ed Espressione
• Identificazione dell’entità Manifestazione
Il record diventa il dataset
che identifica la
manifestazione ed è molto
più ricco di dati rispetto
al record
Un progetto per SBN: importanza dell’autority control
• Authority control per tutte le entità: opera, persone, enti, etc.
• Identificazione e authority per le entità Opera ed Espressione
• Identificazione dell’entità Manifestazione
Il record diventa il dataset
che identifica la
manifestazione ed è molto
più ricco di dati rispetto
al record
Un progetto per SBN: le relazioni
Spesso gli utenti (soprattutto del web) chiedono di
• Aumentare la precisione delle risposte per diminuire il rumore delle
informazioni irrilevanti richiamate che scoraggiano la ricerca.
• Potenziare i collegamenti esterniCreare relazioni con entità collegate e
non direttamente collegate crea valore
aggiunto e fa compiere un salto
qualitative del catalogo inteso come
servizio.
Un progetto per SBN: ottenere l’accesso
Tramite le relazioni SBN potrebbe fornire il
collegamento a biblioteche digitali e ad altre fonti
esterne affinché l’utente possa ottenere l’accesso
diretto alla risorsa (full-text, video, audio, etc.), come
propongono data.bnf.fr e i progetti simili.
Si avrebbe un miglioramento delle potenzialità nella
scoperta, nell’uso dei dati e nella navigazione tra le
informazioni e le risorse bibliografiche.
Un progetto per SBN: i vantaggi per le biblioteche
Riduzione del costo della catalogazione, dovuto al riutilizzo ottimale
dei dati, e un aumento della granularità, a cui corrisponde una
diminuzione della ridondanza informativa.
Gli identificativi (per esempio, URI, ISNI, etc.) permetteranno la
descrizione delle risorse calibrandole per comunità specifiche, come
quella degli editori, distributori, librai, musei, archivi, etc.
L’uso degli identificatori (aspetto fondamentale) basati sul web
renderanno aggiornate le descrizioni delle risorse direttamente citabili
dai catalogatori.
Un progetto per SBN: il risultato, cosa vedremo?
Una pagina web del modello relativo a un autore mostra un reticolo di
informazioni:
• biografia essenziale
• elenco delle opere maggiormente consultate
• elenco dei manoscritti e delle edizioni a stampa (con eventuali link alle
relative rappresentazioni digitali disponibili)
• opere derivate da opere dell’autore
• opere che hanno per soggetto l’autore (fonti bio-bibliografiche)
• opere che hanno per soggetto le opere dell’autore (letteratura critica)
• testi di altri autori correlati
• link diretti a fonti esterne come enciclopedie, repertori, vocabolari, etc.
La quantità di collegamenti non ha limite.
data.bnf.fr
data.bnf.fr della Bibliothèque nationale de France
(BnF) utilizza i linked data e applica gli standard del
web semantico per la pubblicazione dei cataloghi
della Biblioteca e i dati della biblioteca digitale
Gallica.
In data.bnf.fr sono aggregate informazioni
provenienti da diversi cataloghi.
Tecnologia LOD: morte del catalogo?
Le pagine costruite da data.bnf.fr non
sostituiscono i cataloghi esistenti e i database
che essi sfruttano, bensì fungono da collante tra
di loro, per rendere i dati della Biblioteca
meglio funzionanti sul web, cioè utili per
fornire un servizio di informazione, con dati
strutturati in modo esplicito e URI permanenti.
L’SBN del futuro (e del presente) non è solo catalogo.
È necessaria, dunque, anche per SBN, l’integrazione con
le banche dati e le biblioteche digitali per avere accesso
al più ampio universo bibliografico possibile.
Una politica catalografica di apertura a tutti i partner
disponibili porterebbe a un rafforzamento dei servizi a
favore dei lettori.
Per tutto ciò occorre una regia forte che possa governare
SBN con autorevolezza.
Un progetto per SBN
SBN sarà capace di evolversi
- in parallelo alle evoluzioni già avvenute in Europa?
FRBRizzazione
- in parallelo all’evolversi degli standard
internazionali?
- in parallelo ai servizi offerti nell’era digitale?
- data.bnf.fr: un grosso investimento culturale e
finanziario, un cambiamento non indolore verso i
linked open data: punto di riferimento europeo
Il catalogo non esiste senza una tecnologia.
Il catalogo è dipendente dalla tecnologia.
È sempre stato così.
Oggi la tecnologia è caratterizzata dai
linked data, rivolta alle macchine, per la
realizzazione del web semantico tramite
processi inferenziali.
I linked data danno risultati migliori anche
se solo abbinati ai cataloghi attuali.
Un progetto per SBN
Occorre un passaggio lento, consapevoli come siamo
delle risorse umane e finanziarie disponibili.
La progettualità esiste e va valorizzata.
Lo stesso record (o dataset) può essere
personalizzato per essere servito a utenti diversi,
con esigenze e percezioni diverse.
Credo che la cosa importante sia prendere atto che SBN abbia
in se stesso la capacità di rigenerarsi nella direzione intrapresa
a livello internazionale.
Non un sovvertimento, quindi, ma un’evoluzione, magari
piuttosto accentuata.
Le stesse RDA, già adottate o in corso di adozione da parte
delle Nazionali europee, non sono la negazione di Reicat; credo
fermamente che, anzi, fra i due strumenti esiste la possibilità
di un'integrazione. Per questo sarebbe positivo un terreno di
confronto civile.