firenze, 18 ottobre 2016 - piattaforma moodle · bibframe-bibliographic framework as a web of data:...

52
SBN: un bilancio per il futuro Firenze, 18 ottobre 2016 Great tradition linked data e SBN Il futuro che c’è già di Mauro Guerrini Università di Firenze

Upload: trinhtu

Post on 10-Apr-2018

215 views

Category:

Documents


2 download

TRANSCRIPT

SBN: un bilancio per il futuroFirenze, 18 ottobre 2016

Great tradition

linked data e SBN

Il futuro che c’è già

di Mauro GuerriniUniversità di Firenze

2

Sommario

Filone teorico: FRBR come modello concettuale e riflessione teorica

alla base di tutti i progetti realizzati dal 2000 a oggi.

Linked data come tecnologia di supporto.

Proposte per un nuovo SBN: muoversi nell’alveo di riferimento

europeo e internazionale e apportare il nostro contributo.

3

Michael Gorman ha parlato di Great Tradition citando le

tappe che hanno testimoniato i punti più alti

dell’eleborazione teorica nel settore della catalogazione;

lo fece nel messaggio rivolto a Seymour Lubetzky in

occasione del festeggiamento dei cento anni dell’illustre

bibliotecario, tenuto all’UCLA il 18 aprile 1998

Saggio edito in traduzione italiana in “Biblioteche oggi”, vol. 18, n. 6 (luglio-Agosto

2000), p. 6-11.

Alla fine degli anni Ottanta del secolo scorso molti

cominciano a denunciare la necessità di una revisione

dei Principi di Parigi del 1961

ICP

2009e aggiornamenti

FRBR

1998e aggiornamenti

La Great Tradition – Filone teorico: FRBR e ICP

L’era digitale

Il baricentro dell’universo della conoscenza

registrata è andato spostandosi dalle collezioni

possedute da biblioteche, archivi e musei alle

collezioni accessibili nel web, con una loro

espansione amplissima e rapidissima, seguita –

o sollecitata – da milioni di persone.

Dato di fatto:

Alcune importanti biblioteche, soprattutto europee e

nordamericane (dal 2004 circa) stanno sperimentando

l’applicazione delle tecnologie dei linked data per la

pubblicazione e l’utilizzo dei propri dati sul web.

6

Filone applicativo: le biblioteche nel web semantico

Le biblioteche nel web semantico: On the record - 2008

Necessità del cambiamento affinché i dati del catalogo siano

del web e non solo nel web: frase formulata in varie forme e

occasioni, la più significativa delle quali è On the record, il

report della Library of Congress Working Group on the Future of

Bibliographic Control, del 2008; frase ripresa e resa famosa da

Karen Coyle.

https://www.loc.gov/bibliographic-future/news/lcwg-ontherecord-jan08-final.pdf

Si richiama alla necessità di:

trasformare la descrizione testuale in set di dati (dataset)

usabili per processi ed elaborazioni automatiche da parte di

macchine;

rendere gli elementi di dati univocamente identificabili (URI);

assicurare la compatibilità dei dati con le tecnologie e gli

standard del web;

usare un linguaggio trasversale e interoperabile nella realtà

del web.

Le biblioteche nel web semantico: On the record

Nuovi modelli catalografici e linked data

Adozione delle logiche e delle tecnologie del web semantico nel contesto

delle biblioteche:

•ripensamento profondo del modello del catalogo finora conosciuto

(matanoia);

•rifondazione dei principi, degli standard e delle normative

catalografiche.

RDA: (implementato il 31 marzo 2013) standard per la metadatazione delle

risorse nell’era digitale => non codice di regole, ma linee guida che si

muovono all’interno della filosofia del web semantico e dei linked data.

Nuovi modelli catalografici e linked data

«MARC must die!»

Il formato piatto (testuale) del record MARC è ritenuto inadeguato a

esprimere le relazioni tra entità bibliografiche che il modello FRBR

considera fondamentali.

Affermare che MARC è morto è una provocazione: l’accento è da porsi

sul riuso, la reinterpretazione, a partire dal progetto BIBFRAME, che

pone in evidenza l’esigenza di riutilizzare – reinterpretandoli – i milioni

di dati già presenti nei cataloghi.

Nuovi modelli catalografici e linked data

BIBFRAME - Bibliographic Framework as a

Web of Data: Linked Data Model and

Supporting Services

Primo modello BIBFRAME (2012)

Il progetto Bibliographic framework

initiative (BIBFRAME) della Library of

Congress propone un modello del tipo

entità-relazione il cui scopo è la transizione

degli standard di catalogazione

all’ambiente dei linked data, per rendere le

informazioni bibliografiche più utilizzabili

all’interno e all’esterno della comunità

bibliotecaria.

BIBFRAME – Modello dati versione 2.0 (aprile 2016)

BIBFRAME riprende FRBR e

propone un modello

semplificato:

Work = Opera

Instance = Istanza

Item

Nuovi modelli catalografici e linked data

L’adozione di FRBR implica il passaggio

dal record management al data management

Il record testuale, da rigido, statico, si trasforma in un dataset, in

un insieme di dati, ciascuno identificato e descritto tramite

metadati di qualità, specifici, comprensibili per l’utente e

preparati per l’uso (cfr. International Open Data Conference,

Madrid, ottobre 2016: IODC16).

Nuovi modelli catalografici e linked data

Il dato è, così, un elemento autonomo, auto-consistente,

usabile (e riusabile) in contesti differenti e in

rappresentazioni differenti.

Non si ha più la redazione di un record, bensì la

definizione dei dati (relativi a un’opera, a un autore,

etc.) formulati tramite termini estratti da vocabolari

controllati e da ontologie.

Importanza delle relazioni

Il procedimento d’identificazione aumenta la granularità deidati che servono a identificare le entità, ma non a chiarire lerelazioni che intercorrono tra di esse.

Questo è il motivo per cui collegare le entità è oggi unobiettivo centrale: linkare (linked data), connettere le entitàsulla base di relazioni concettuali e funzionali.

Sono le relazioni che permettono di navigare tra entità, trametadati di tipo e origine diversa, funzione concepita da ElaineSvenonius in The intellectual foundation of internationalorganization, Cambridge, Mass., The MIT Press, 2000.

Lo sviluppo di OPAC sempre più avanzati consente di interrogare più

banche dati e di ricostruire, idealmente la Famiglia di opere

Navigare

Occorre procedere nella direzione di:

rendere ricercabili in un unico sistema di consultazione le

varie tipologie di risorsa possedute o ritenute rilevanti;

integrare i vari oggetti digitali coinvolti (per esempio, libro,

videoconferenza sul libro edita su YouTube, le varie fonti

correlate, i commentari, le recensioni, etc.

Esempio (che segue) di data.bnf.fr

Resource Description and Access

Identificare – Collegare – Presentare – Scoprire

18

Identificare e collegare

Alexandre Dumas

Presentare Scoprire

Progetti europei realizzati in linked open data:

un futuro che c’è già

FRBR base comune dei progetti europei

FRBR

data.bnf.fr

bnb.data.bl.uk

dnb.de.dataservice

datos.bne.es

I linked data….una realtà

http://data.bnf.fr/

http://bnb.data.bl.uk/

Nuove sfide

Arricchire BNB linked open data con collegamenti ad altre

risorse (sono in valutazione ISNI, LC/NACO e Dbpedia).

Valutazione di collegamenti di maggiore granularità relativi ai

luoghi (rendere possibile una mappatura esatta tra Geonames

e i luoghi di pubblicazione).

Collegamento di BNB come linked open data con altre

bibliografie nazionali (sperimentazione con le risorse

bibliografiche della Deutsche Nationalbibliothek).

I linked data ... una realtà

http://libris.kb.se/A partire dal 2011 la Bibliografia Nazionale e l’Authority

file svedese, due sottoinsiemi del database LIBRIS,

hanno messo a disposizione i loro dati in formato RDF.

I linked data….una realtà

«In questo modo chiunque può vedere, valutare, fare riferimento e in ultima

analisi, contribuire al lavoro svolto dalla Biblioteca Nazionale [svedese]. Ciò

implica che la visibilità e l’apertura conduce a una maggiore qualità dei dati

[…]. Chiunque può ottenere le modifiche apportate all’Authority file entro

pochi secondi dal cambiamento. Quanto appena descritto va visto come un

investimento strategico nella direzione dell’apertura e la conclusione logica

dell’idea cooperativa […].

Questa, in sintesi, la promessa dei linked data, e cioè che si può distribuire la

creazione dell’informazione senza doverla costantemente aggregare per

renderla utile».

(Malmsten, M. (2013). Cataloguing in the open-the disintegration and

distribution of the record. JLIS. it, 4 (1), 417).

Un progetto per SBN

Perché una versione data.sbn.it?

Un progetto per SBN Perché una versione

data.sbn.it?

- Necessità di descrivere la produzione digitale (e-

books, etc.)

- Necessità di avere numerosi partner che partecipano

alla realizzazione di “catalogo” rinnovato; per

esempio, Wikipedia e gli enti coinvolti nella

redazione della nuova BNI annunciata poche

settimane fa.

Un progetto per SBN Perché una versione data.sbn.it?

Alcune proposte di lavoro, su cui riflettere e lavorare insieme.

- Necessità di una vision che definisca una programmazione a lungo termine anziché interventi episodici dettati dalle mode.

- Necessità di usare il medesimo linguaggio internazionale (linked data) per poter parlare col resto del mondo dell'informazione e delle biblioteche.

- Raccordo di SBN con le iniziative di ItaliaDigitale

- Necessità che l’Italia sia all’interno dei circuiti internazionali

- SBN dovrebbe usare la consapevolezza del proprio ruolo e la

ricchezza dei propri dati per essere sempre più aperta

alla molteplicità delle realtà presenti sulla rete.

- Nel suo ruolo di servizio bibliotecario nazionale SBN

dovrebbe perseguire la missione di mettere a

disposizione della comunità italiana e internazionale i

dati bibliografici prodotti, come fanno le principali

Biblioteche Nazionali europee.

Un progetto per SBN: perché una versione data.sbn.it?

Un progetto per SBN: perché una versione data.sbn.it?

- Necessità di creare un nuovo modello di Indice SBN che

utilizzi la tecnologia linked data in modo conforme ai principi

e alle finalità del web semantico.

Dati visibili, disponibili e liberamente utilizzabili nel web.

L’applicazione dei linked data consente di integrare i dati bibliografici

per la ricerca web rispondendo così alle aspettative di chi opera in

ambiente digitale (dati del web e non solo nel web).

Le biblioteche non possono ignorare la loro scarsa rilevanza sul

web, dove i loro cataloghi non sono integrati e ricercabili

L’universo bibliografico cresce a un ritmo che rende

complesso attingere a tutte le informazioni disponibili

Un progetto per SBN: perché una versione data.sbn.it?

Un progetto per SBN: importanza dell’autority control

Applicazione del modello FRBR per identificare univocamente le entità

per poi procedere a creare le relazioni e i link

Importanza del lavoro di authority control

SBN è stato un precursore con l’uso del VID (Vedette Identifier), un

identificatore univoco della forma dell’autore

Un progetto per SBN: importanza dell’autority control

• Authority control per tutte le entità: opera, persone, enti, etc.

• Identificazione e authority per le entità Opera ed Espressione

• Identificazione dell’entità Manifestazione

Il record diventa il dataset

che identifica la

manifestazione ed è molto

più ricco di dati rispetto

al record

Un progetto per SBN: importanza dell’autority control

• Authority control per tutte le entità: opera, persone, enti, etc.

• Identificazione e authority per le entità Opera ed Espressione

• Identificazione dell’entità Manifestazione

Il record diventa il dataset

che identifica la

manifestazione ed è molto

più ricco di dati rispetto

al record

Un progetto per SBN: le relazioni

Spesso gli utenti (soprattutto del web) chiedono di

• Aumentare la precisione delle risposte per diminuire il rumore delle

informazioni irrilevanti richiamate che scoraggiano la ricerca.

• Potenziare i collegamenti esterniCreare relazioni con entità collegate e

non direttamente collegate crea valore

aggiunto e fa compiere un salto

qualitative del catalogo inteso come

servizio.

Un progetto per SBN: ottenere l’accesso

Tramite le relazioni SBN potrebbe fornire il

collegamento a biblioteche digitali e ad altre fonti

esterne affinché l’utente possa ottenere l’accesso

diretto alla risorsa (full-text, video, audio, etc.), come

propongono data.bnf.fr e i progetti simili.

Si avrebbe un miglioramento delle potenzialità nella

scoperta, nell’uso dei dati e nella navigazione tra le

informazioni e le risorse bibliografiche.

Un progetto per SBN: i vantaggi per le biblioteche

Riduzione del costo della catalogazione, dovuto al riutilizzo ottimale

dei dati, e un aumento della granularità, a cui corrisponde una

diminuzione della ridondanza informativa.

Gli identificativi (per esempio, URI, ISNI, etc.) permetteranno la

descrizione delle risorse calibrandole per comunità specifiche, come

quella degli editori, distributori, librai, musei, archivi, etc.

L’uso degli identificatori (aspetto fondamentale) basati sul web

renderanno aggiornate le descrizioni delle risorse direttamente citabili

dai catalogatori.

Un progetto per SBN: il risultato, cosa vedremo?

Una pagina web del modello relativo a un autore mostra un reticolo di

informazioni:

• biografia essenziale

• elenco delle opere maggiormente consultate

• elenco dei manoscritti e delle edizioni a stampa (con eventuali link alle

relative rappresentazioni digitali disponibili)

• opere derivate da opere dell’autore

• opere che hanno per soggetto l’autore (fonti bio-bibliografiche)

• opere che hanno per soggetto le opere dell’autore (letteratura critica)

• testi di altri autori correlati

• link diretti a fonti esterne come enciclopedie, repertori, vocabolari, etc.

La quantità di collegamenti non ha limite.

Un progetto per SBN: cosa vedremo? … un futuro che c’è già, data.bnf.fr

data.bnf.fr

data.bnf.fr della Bibliothèque nationale de France

(BnF) utilizza i linked data e applica gli standard del

web semantico per la pubblicazione dei cataloghi

della Biblioteca e i dati della biblioteca digitale

Gallica.

In data.bnf.fr sono aggregate informazioni

provenienti da diversi cataloghi.

Tecnologia LOD: morte del catalogo?

Le pagine costruite da data.bnf.fr non

sostituiscono i cataloghi esistenti e i database

che essi sfruttano, bensì fungono da collante tra

di loro, per rendere i dati della Biblioteca

meglio funzionanti sul web, cioè utili per

fornire un servizio di informazione, con dati

strutturati in modo esplicito e URI permanenti.

L’SBN del futuro (e del presente) non è solo catalogo.

È necessaria, dunque, anche per SBN, l’integrazione con

le banche dati e le biblioteche digitali per avere accesso

al più ampio universo bibliografico possibile.

Una politica catalografica di apertura a tutti i partner

disponibili porterebbe a un rafforzamento dei servizi a

favore dei lettori.

Per tutto ciò occorre una regia forte che possa governare

SBN con autorevolezza.

Un progetto per SBN

SBN sarà capace di evolversi

- in parallelo alle evoluzioni già avvenute in Europa?

FRBRizzazione

- in parallelo all’evolversi degli standard

internazionali?

- in parallelo ai servizi offerti nell’era digitale?

- data.bnf.fr: un grosso investimento culturale e

finanziario, un cambiamento non indolore verso i

linked open data: punto di riferimento europeo

Il catalogo non esiste senza una tecnologia.

Il catalogo è dipendente dalla tecnologia.

È sempre stato così.

Oggi la tecnologia è caratterizzata dai

linked data, rivolta alle macchine, per la

realizzazione del web semantico tramite

processi inferenziali.

I linked data danno risultati migliori anche

se solo abbinati ai cataloghi attuali.

Un progetto per SBN

Occorre un passaggio lento, consapevoli come siamo

delle risorse umane e finanziarie disponibili.

La progettualità esiste e va valorizzata.

Lo stesso record (o dataset) può essere

personalizzato per essere servito a utenti diversi,

con esigenze e percezioni diverse.

Credo che la cosa importante sia prendere atto che SBN abbia

in se stesso la capacità di rigenerarsi nella direzione intrapresa

a livello internazionale.

Non un sovvertimento, quindi, ma un’evoluzione, magari

piuttosto accentuata.

Le stesse RDA, già adottate o in corso di adozione da parte

delle Nazionali europee, non sono la negazione di Reicat; credo

fermamente che, anzi, fra i due strumenti esiste la possibilità

di un'integrazione. Per questo sarebbe positivo un terreno di

confronto civile.

Parafrasando la quinta legge della biblioteconomia di

Ranganathan: «SBN è un organismo in crescita»

E siamo qui per farlo crescere sano e bello!

Grazie

Mauro Guerrini

Università di Firenze

[email protected]