données ouvertes et biodiversité - geonature · vers des données liées utilisation de standards...

Post on 14-Jul-2020

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Parc national des CévennesPrénom Nom du rédacteur à modifier dans en-tête et pied de page

Données ouvertes et biodiversité

2

Vers des données ouvertes

Open Data

Linked Open Data

Private Data

3

Approche traditionnelle

Silo de données

4

Silos de Données

occurrence

nomenclature

bibliographie

image

observateursgéographie

● Redondance des données (taxonomie, géographie, ...)● Nettoyage indépendant● Mise à jour manuelle

Les efforts ne sont pas partagés

occurrence

nomenclature

géographie

Structure 1

Structure 2

5

Structuration propre

● Champs différents

● Différents nom pour le même champ / Même nom pour différent champs

● Différentes façon d’interpréter un champ

● Vocabulaires différents

Demande un effort de compréhension pour chaque source de données

6

Vers des données liées

7

Parc national des Cévennes

Données liées

occurrence

phylogénie

bibliographie

observateurs

physiologie

protéinegéographie nomenclature

image

Données liées :● éviter la redondance● facilité l’exploration et l’émergence de nouvelles

données

8

Vers des données liées

● Utilisation de standards : > parler le même langage

> profiter de la réflexion de la communauté

> favoriser l’échange des données

« le Web sémantique fournit un modèle qui permet aux données d'être partagées et réutilisées entre plusieurs applications, entreprises et

groupes d'utilisateurs » W3C

9

Structuration des données : Principes

● Triplet de données● Données sous forme de graph● Utilise des vocabulaires existants (ontologies)● Utiliser des adresses URI HTTP qui existent sur le Web

10

Schtroumf à lunette a identifié une alouette

11

Structuration des données

Schtroumf

http://fr.dbpedia.org/resource/Schtroumpf_à_Lunettes

Personfoaf:Person

rdf:type

Schtroumpf à Lunettes

Rdf:label

Alouettedes

Champs

dwc:identfication

Taxon Name

rdf:type

http://taxref.mnhn.fr/lod/name/3676

Alauda arvensis Linnaeus, 1758

skos:prefLabel

12

Parc national des Cévennes

LOD

● 2 niveaux> Structuration sémantique des données

=> Utilisation de standards

> Lier les données

=> Utilisation de ressources existantes

13

Parc national des Cévennes

LOD et biodiversité

14

Parc national des Cévennes

Standards en biodiversité - Occurences

● Darwin-SW : DEE● OBOE ; PO, … : Détail des informations collectés

15

Parc national des Cévennes

Mixer les standards

16

Parc national des Cévennes

Standards en biodiversité - Taxonomie

● TaxonConcept, NCBI, ● Dbpedia…● Taxref-LD=> Jeux de données liés ouvre toutes les passerelles

http://lod-cloud.net/clouds/lod-cloud.svg

17

Parc national des Cévennes

Alouette des champs

https://www.wikidata.org/wiki/Q25961http://eol.org/pages/916864

https://www.gbif.org/species/8077224

https://inpn.mnhn.fr/espece/cd_nom/3676

taxon

occurence

...

http://taxref.mnhn.fr/lod/name/3676

https://commons.wikimedia.org/wiki/File:Alauda_arvensis_2.jpg

18

Parc national des Cévennes

Enrichissement : exemple taxonomique

● Utilisation de wikidata pour récupérer des médias sur les taxons

SELECT ?item ?image

WHERE { ?item wdt:P18 ?image. ?item wdt:P3186 '3676'

}

https://query.wikidata.org

19

Parc national des Cévennes

Enrichissement : exemple taxonomique

● Exemple au PNC : Récupération de 6670 médias pour 4164 espèce sur 6680

https://github.com/PnX-SI/TaxHub/issues/150import_wikimedia_commons

20

Parc national des Cévennes

Publication

● Publier son jeux de données en rdf => google refine● Sparql

> Requête de graph

> Attaque plusieurs jeux de données

Mon jeu de données → Taxref-LD → Dbpedia → UICN

21

Parc national des Cévennes

Comment contribuer ?

● Microdata :> Insérer du sémantique dans les pages web

● Publier ses jeux de données> En RDF Darwin-SW avec Taref-LD

22

Parc national des Cévennes

Conclusion

● Open data : > Il n’y a pas de petite contribution

> Nouveau usage

● LOD : > Pratique pour l’enrichissement de données

> Publication des données. Qui ?

top related