persistent identifiers 20150429_adlibgebruikersdag_v0_2

Post on 24-Jul-2015

55 Views

Category:

Presentations & Public Speaking

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

PERSISTENT URI’S IN ADLIB

Bert Lemmens | PACKED

27 april 2015 | Breukelen

● 2005: opgericht door Museum Dhondt-Dhaenens, S.M.A.K., M HKA & argos.

● 2011: erkend door de Vlaamse Gemeenschap als Expertisecentrum Digitaal Erfgoed.

● Vlaamse projecten: CEST, Scoremodel Digitale Duurzaamheid, TRACKS - Archiefzorg in de Kunstensector, VIAA - digitalisering A/V dragers, opencultuurdata.be, persistente identificatie

● Europese projecten: ATHENAplus, PREFORMA, europeana.space

● Scoremodel | Erfgoedstats | SODA | SIP creator

● packed.be | scart.be | projectcest.be | scoremodel.org

Voor wie ons nog niet kent: Dit is packed.

Project ‘Persistente Identificatie’● okt 2013 – sep 2014

● opdracht en financiering

Vlaamse Overheid, Departement Cultuur, Jeugd, Sport en Media

● partners:

Vlaamse Kunst Collectie (KMSK Antwerpen, MSK Gent, Groeningemuseum Brugge)

Contemporary Art Heritage Flanders (M HKA, Mu.Zee, SMAK, Middelheimmuseum)

● LUKAS

● Collectie Vlaamse Gemeenschap

Deze is een update van het

project persistente

identificatie.

5

● persistente URI’s● project update● URI’s documenteren● voorstel!

De agenda:

PERSISTENTE URI’S?

http://kmska.be/collectie/work/id/1856

kunstwerk

Persistente URI’s zijn webadressen voor kunstwerken.

m.n. de ‘real life’ kunstwerken op zaal

http://kmska.be/collectie/work/data/1856

metadata

Persistente URI’s zijn webadressen voor informatie

over kunstwerken.

De informatie die je bijvoorbeeld op je collectiewebsite

plaatst.

http://kmska.be/collectie/work/representation/1856

beeld

Persistente URI’s zijn webadressen voor beelden van

kunstwerken.

De foto’s van de kunstwerken uit je

collectie

PERSISTENTE URI =

● webadres● naam voor kunstwerk, metadata en beeld● opgesteld volgens standaard regels ● onveranderlijk● leesbaar ● geautoriseerd door het museum

Kortom: het kanaal waarlangs je

betrouwbare informatie over je collectie

verspreid op het web.

PERSISTENTE URI’S.WAAROM ZOU U?

#1 BETROUWBARE CONTENT NEGOTIATIE

http://www.middelheimmuseum.be/Museum_Middelheim_NL/MiddelheimNL/MiddelheimNL-Collectie/Aanwinsten/MiddelheimNL-Collectie-Aanwinsten-2012/Firmament-III.htmlURI’s zijn

persistent binnen de levensduur van je eigen website

17

http://www.middelheimmuseum.be/pics/Stad/Bedrijven/Cultuur_sport_recreatie/CS_Musea/Middelheim/Tentoonstellingen/x_jc_MIDD_Gormley121113_22.jpg

En ze zijn doorgaans niet bedoeld voor ‘human agents’.

Dat zorgt voor problemen als je URI’s gaat gebruiken voorbij de levensduur van je

website

Persistente URI?

En het maakt jouw beeld moeilijk vindbaar tussen

alle gelijkaardige beelden op het web

werkhttp://

kmska.be/collectie/

work/id/1856

datahttp://

kmska.be/collectie/

work/data/1856

beeldhttp://

kmska.be/collectie/

work/representation

/1856

Persistente URI’s maken jouw informatie en beelden uniek en

langdurig identificeerbaar op het

web.

werkhttp://cvg.be/

collectie/work/id/1856 data

http://kmska.be/collectie/

work/data/1856

beeldhttp://

kmska.be/collectie/

work/representati

on/1856

beeldhttp://

lukasweb.be/collectie/work/representation/

1856

datahttp://cvg.be/

collectie/work/data/

1856

datahttp://

vkconline.be/collectie/work/data/

1856

Het onderscheid met info en

beelden uit andere collecties is helder

#2 INFORMATIE CLUSTEREN OP HET

WEB

23

Dat wordt erg belangrijk als we

met z’n allen info en beelden op het web

gaan plaatsen

Het wordt pas echt interessant als je zo

nieuwe info en beelden op het

spoor komt.

CIDOC STATEMENT ON LINKED DATA IDENTIFIERS (2012)

● Museums are the sole authority with responsibility for establishing globally unique and persistent identities (URIs) for each of the objects in their collections;

● Each museum should establish and publish on the internet such a unique and persistent identity – preferably as http URI (= webadres) – for each of its objects;

● This URL should resolve to a human‐readable description of the object, which is sufficiently detailed to identify it unambiguously;

● Ideally, this URL should additionally resolve to a comparable description in a machine processible format, using best practice Linked Data principles;

● When describing the relationship of the collection object to its cultural context (people, places, events, etc.), the museum should where possible reuse URLs from common frameworks, rather than minting its own URLs for these concepts;

http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/PDF/StatementOnLinkedDataIdentifiersForMuseumObjects.pdf

Daarom is het cruciaal dat je jezelf

als autoriteit kenbaar maakt over de info en beelden die jij verspreid.

werkhttp://cvg.be/

collectie/work/id/1856

datahttp://

kmska.be/collectie/

work/data/1856

beeldhttp://

kmska.be/collectie/

work/representati

on/1856

beeldhttp://

lukasweb.be/collectie/

work/representati

on/1856

datahttp://cvg.be/

collectie/work/data/

1856

makerhttp://

viaf.org/viaf/

312406452/

typehttp://

vocab.getty.edu/aat/

300033799

En het werkt ook omgekeerd: jij

maakt gebruik van de autoriteit van

anderen.

PERSISTENT?

Kort over hoe we in dit project

‘onveranderlijkheid’ nastreven.

Eenvoudige vorm

Voor meer details over de principes die we gebruiken: lees

het ISA rapport!

#1 EENVOUDIGE VORM

http://[domein]/ verplicht

[type object]/ optioneel

[type document]/ optioneel

[identificatienummer] verplicht

Een eenvoudige vorm maakt het

makkelijker om de onveranderlijkheid

van URI’s te bewaren.

#2 CONTROLE OVER DOMEINNAAM

museum domein collectiedata

VKC http://vlaamsekunstcollectie.be/collection/

Groeningemuseum http://groeningemuseum.be/collection/

KMSKA http://kmska.be/collection/

MSKGent http://mskgent.be/collection/

LUKAS http://lukasweb.be/collection/

S.M.A.K. http://smak.be/collection/

M HKA http://mukha.be/collection/

Middelheimmuseum http://middelheimmuseum.be/collection/

Mu.Zee http://muzee.be/collection/

CVG http://kunstenenerfgoed.be/cvg/collection/

Elke museum bepaalt een

(sub)domein dat voor onveranderlijke

data dient.

#3 GEBRUIK BESTAANDE ID’S

museum inventaris-nummer

Persistente URI - ID

Groeningemuseum

0.2.GRO0002.II .../collection/work/id/0_2_GRO0002_II

SMAK nvt nvt

MuHKA VH0178.1 .../collection/work/id/VH0178_1

Middelheim MID.B.109 .../collection/work/id/MID_B_109

Mu.Zee B000071(a) .../collection/work/id/B000071_a

MSKGent 1920-DB-1,2,3 .../collection/work/id/1920-DB-1_2_3

KMSKA 831/4 .../collection/work/id/831_4

CVG M423 A - N .../collection/work/id/M423_A-N

VKC nvt nvt

LUKAS nvt nvt

We hergebruiken inventarisnummers

omdat we daar al de ‘onverandelijkheid’

van nastreven.

#4 ZORG DAT HIJ GEBRUIKT WORDT >>> HTTP RESOLVING

naam = Persistente URI locatie = URL

werk http://middelheimmuseum.be/collection/work/id//MID.B.541

n/a

metadata http://middelheimmuseum.be/collection/work/data//MID.B.541

http://www.middelheimmuseum.be/Museum_Middelheim_NL/MiddelheimNL/MiddelheimNL-Collectie/Aanwinsten/MiddelheimNL-Collectie-Aanwinsten-2012/Firmament-III.html

beeld http://middelheimmuseum.be/collection/work/representation//MID.B.541

http://www.middelheimmuseum.be/pics/Stad/Bedrijven/Cultuur_sport_recreatie/CS_Musea/Middelheim/Tentoonstellingen/x_jc_MIDD_Gormley121113_22.jpg

We gebruikten het http protocol omdat we dan maximaal zeker zijn dat

medewerkers de URI’s ook gaan gebruiken.

PROJECT UPDATE

34

MILESTONES

● +34.000 kunstwerken met ID● >90% kunstenaars & objectnamen met ID● Demonstrator: clusters werken!● Resolver: gebruik je eigen webserver!● Datauitgever Handboek

De belangrijkste resultaten van 2014:

35

#1. +34.000 WERKEN MET ID

totaal aantal data pids 43.264

totaal aantal work pids 34.358

aantal work pids met 1 data pid 26.575 77 %

aantal work pids met 2 data pid’s 6.782 20 %

aantal work pids met 3 data pid’s 908 2,5 %

aantal work pids met 4 data pid’s 68 <1 %

aantal work pids met meer dan 4 data pid’s 25 <1 % 

We weten hoeveel informatie we

hebben en hoeveel kunstwerken we

hebben

#2 TERMINOLOGIEEN: VERVAARDIGER

>> 90% van de 10.183 naamsvermeldingen geidentificieerd

>> Aantal unieke personen in de 10 collecties – geschat tussen 7.025 en 7.750

Aantal naams-vermeldingen

Aantal unieke strings in de naams- vermeldingen

Aantal records geïdentificeerd met maar 1 pURI

Aantal records geïdentificeerd met maar 2 pURI

Aantal records geïdentificeerd met maar 3 pURI

Aantal records geïdentificeerd met maar 4 pURI

10.183 7.750 1.373 (14%) 3.424 (34%) 4.083 (40%) 204 (2%)

Externe bron Aantal geïdentificeerde naamsvermeldingen

Aantal unieke kunstenaars

Aantal naamsvarianten gehaald uit de externe bron

RKDartists 8.708 7.025 21.413

VIAF 7.791 4.584 111.711

Wikidata 4.463 2.326 9.156

ODIS 347 165 -

Voor vrijwel alle kunstenaars konden

we bijkomende informatie uit

externe bronnen koppelen.

#2 TERMINOLOGIEEN: OBJECTNAAM

Aantal unieke waarden van objectnamen

Aantal unieke waarden geidentificieerd met een AAT-id

Aantal unieke AAT concepten

Engelse waarden

Franse waarden

Duitse waarden

Nederlandse waarden

697 663 344 1215 649 208 1166

• 958 records aangeleverd door musea

• 697 unieke waardes, waarvan 663 (95%) hebben een AAT-id gekregen

• eigenlijk gaat het over 344 unieke concepten

• nu doorzoekbaar op 3238 termen in meerdere talen

Het gebruik van objectnamen we

verrassend beperkt.

#3 DEMONSTRATOR: CLUSTERS!

Uit de tests met een eenvoudige

aggregator bleek dat persistente URI’s de vindbaarheid van info

een beelden sterk verbetert.

#3 DEMONSTRATOR: VERRIJKING!

En verrijking met dat uit VIAF,

RKDartists, Getty en Wikidata maakt kleine records veel

interessanter.

#4 HTTP RESOLVER TOOL

En we werken aan een tool om beheer

van persistente URI’s haalbaar te maken

voor museummedewerkers

.

#4 HTTP RESOLVER TOOL

Die tool is vrij beschikbaar.

#5 DATA UITGEVER + HANDBOEK

reso

lve

rmanagement

IT-verantwoordelijke

data uitgever

machine applicatie

We maken ook een handboek voor gebruik in het

museum.

#5 DATA UITGEVER + HANDBOEK

Te vinden op de CEST wiki.

44

TOEKOMST?

● Events > levensloop persistent identificeren

● Wikidata > LOD publicatie

● Data Cleansing met Open Refine > zelf semi-automatisch persistente URI’s linken voor personen, plaatsen en concepten> zoek Alina en Trinneke! en volg de workshop!

De volgende stappen voor 2015:

PERSISTENTE URI’S DOCUMENTEREN

46

VALKUILEN

● URI’s duurzaam documenteren?

● Extra werklast vermijden?

De twee grootste valkuilen voor ons project tot nog toe:

47

VALKUILEN

● URI’s duurzaam documenteren?● in collectiedata > in het collectiebeheersysteem● standaard beschrijvingsregels voor persistente URI’s

● Extra werklast vermijden?● invoer automatiseren● maar: flexibeliteit om vorm URI’s te bepalen

En hoe we die denken aan te

pakken.

PERSISTENTE URI’S IN HET WILD!

Daarvoor zijn we inspiratie gaan

opdoen bij anderen.

49

GEMEENTEMUSEUM

Het Gemeentemuseum documenteert

een persistent ID.

Het ID is niet het inventarisnummer.

Lijkt ook geen priref.

50

GEMEENTEMUSEUM

Maar gebruikt andere ID’s in zijn

URI’s

51

RIJKSMUSEUM

Ook het Rijksmuseum

documenteert een persistent ID.

ID is geen inventarisnummer,

lijkt een priref.

52

RIJKSMUSEUM

En verpakt die in een Handle URI

53

AMSTERDAM MUSEUM

Amsterdam Museum

documenteert de volledige Handlei

URI.

ID is geen inventarisnummer,

lijkt een priref.

MIDDELHEIMMUSEUM

Middelheim stopt URI’s voor personen

in de bestaande velden

Zowel domein en ID in aparte velden als

de volledige link.

55

COLLECTIE VLAAMSE GEMEENSCHAP

56

COLLECTIE VLAAMSE GEMEENSCHAP

CVG stopt domein en ID in nieuwe

velden.

VOORSTEL!

Kwestie van iedereen volgens

dezelfde praktijk te laten werken

58

STANDAARD IMPLEMENTATIE

● PACKED- Project Persistente Identificatie(Alina Saenko) &

● DEN – Netwerk Digitaal Erfgoed(Wilbert Helmus)

● 6 entities/12-17 velden● domain - id● plaats user interface

Samen met DEN om dat dit een structureel

probleem is in de erfgoedsector

59

VOORSTEL

Element Adlib database

Adlib

tag

Element name Visibility Place in user interface Example value repeatable

Automatic?

Adapl needed?

Work Collect.inf od object.pid.domain Yes with option to override value

Tab Object identification, under inventory number

http://kunstenenerfgoed.be/CVG/collection/work/id/

no yes  

oi object.pid.ID Yes with option to override value

Tab Object identification, under inventory number

BK_2179 no yes yes

?? object.pid.URI Yes with option to override value

Tab Object identification, under inventory number

http://kunstenenerfgoed.be/CVG/collection/work/id/BK2179

no yes yes

Record Collect.inf cd collect.pid.domain Yes with option to override value

Tab Object identification, under inventory number

http://kmska.be/collection/work/data/

no yes yes

ci collect.pid.ID Yes with option to override value

Tab Object identification, under inventory number

BK_2179 no yes yes

?? collect.pid.URI Yes with option to override value

Tab Object identification, under inventory number

http://kmska.be/collection/work/data/BK_2179 

no yes yes

Image Photo.inf pd photo.pid.domain Yes with option to override value

Tab Media identification, under ‘object identifier’

http://kmska.be/collection/work/representation/

no yes yes

pi photo.pid.ID Yes with option to override value

Tab Media identification, under ‘object identifier’

BK_2179 no yes yes

?? photo.pid.URI Yes with option to override value

Tab Media identification, under ‘object identifier’

http://kmska.be/collection/work/irepresentation/BK_2179

no yes yes

Date Collect.inf pt production.date.normalised.type

no   ISO 8601 yes yes yes

pv production.date.normalised.value

no   1901/2000 yes yes yes

Artist or custodian

People.inf pd people.pid.domain yes Tab People identification, under ‘object identifier’

http://viaf.org/viaf/ yes Annotation tool

yes

pi people.pid.ID yes Tab People identification, under ‘object identifier’

71417899 yes Annotation tool

yes

?? people.pid.URI yes Tab People identification, under ‘object identifier’

http://viaf.org/viaf/71417899 

yes yes yes

Objectname

Thesau.inf td thesau.pid.domain yes Tab Objectname identification, under ‘object identifier’

http://browser.aat-ned.nl/ yes Annotation tool

yes

ti thesau.pid.ID yes Tab Objectname identification, under ‘object identifier’

300078925 yes Annotation tool

yes

?? thesau.pid.URI yes Tab Objectname identification, under ‘object identifier’

http://browser.aatned.nl/300078925 

yes yes yes

Tada!

60

DOCUMENTEN● Projectrapport:

http://www.projectcest.be/index.php/Project_Persistente_identificatie

● Data uitgever handboek:http://www.projectcest.be/index.php/Project_Persistente_Identificatie_II

● Voorstel:http://www.projectcest.be/images/f/fe/20150309_draft_pidimplementation_adlib_V1_2_EN.pdf

● Resolver softwarehttps://github.com/PACKED-vzw/resolver

● Open refinehttp://www.projectcest.be/index.php/Handleiding_Open_Refine

Alle links naar de relevante

documenten. Feedback is van harte welkom!

BEDANKT!

top related