applications du web sémantique
TRANSCRIPT
Applications duweb sémantique
Journée rencontreWeb Éducation
22 octobre 2009
Pourquoi le web sémantique
aujourd’hui?• Accroître l’accessibilité aux contenus • Répondre à de nouvelles questions
– en utilisant une diversité de sources• Qualité et authenticité des sources d’information– Contrôle des contenus par le producteur
• Échanger davantage nos données et nos savoirs
Pourquoi le web sémantique
aujourd’hui?
• Les outils sont là et de plus en plus intéressants
• Et à votre portée!
Certains thèmes abordés
• Technologies et outils• Vocabulaires• Accès public• Bénéfices : – Accessibilité– Transparence– Réutilisation
Déroulement
• Yves Otis : Survol des technologies et enjeux
• Robin Millette : Web sémantique, la partie submergée du web
• Vincent Audette-Chapdelaine : Le Mur mitoyen, un site web microformaté
• Présentation d’exemples d’applications dans des contextes institutionnels
Une règle
Arrêtez-nous si ça devient
incompréhensible!
Technologies et enjeuxdu web sémantique
Yves Otis
Vision originale du web
Une affaire de données clairement identifiées
et liées entre elles
http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-05.html
Quelles données?
• Une simple information – Lieu de naissance du président américain
• Un regroupement de données– Une biographie, un tableau, une page web
• Une collection de données– Liste des écoles– Liste des programmes d’un ministère– Médicaments couverts par le régime d’ass.-méd.
Quelles données?
Quelles données?
Quels problèmes?
• Possibilités de recherche limitée
• Présentation sommaire des données
• Est-ce que les données sont actualisées et fiables?– Difficile de comparer et d’évaluer les sources
Apports du web sémantique
Fournit les outils pour • pour identifier et pour décrire les données (accessibles sur le web)
• pour construire les vocabulaires qui servent à décrire les données et leurs relations
• pour permettre l’exploitation des données (agrégation, recherche, présentation)
Page parfaitement valide,
mais sémantiquement pauvre<p>
Communautique est situé au :</p><p> 65 De Castelnau Ouest, suite 202 <br /> Montréal, Québec,<br /> H2R 2W3 <br /> Métro De Castelnau <br /></p><p> Téléphone : (514) 948-6644 ou 1-877-948-6644 (sans frais)<br /> Télécopieur : (514) 948-3320 <br /> Adresse électronique : <a href="mailto:[email protected]">[email protected]</a></p>
<p> Communautique est situé au :</p><p> 65 De Castelnau Ouest, suite 202 <br /> Montréal, Québec,<br /> H2R 2W3 <br /> Métro De Castelnau <br /></p><p> Téléphone : (514) 948-6644 ou 1-877-948-6644 (sans frais)<br /> Télécopieur : (514) 948-3320 <br /> Adresse électronique : <a href="mailto:[email protected]">[email protected]</a></p>
Page toujours valide, mais sémantiquement
plus riche<div id="" class="vcard"> <div class="org"> <p> <a class="url fn n" href="http://www.communautique.qc.ca">Communautique </a> est situé au : </p> </div> <div class="adr"> <div class="street-address"> 65 De Castelnau Ouest, suite 202 </div> <span class="locality">Montréal</span>, <span class="region">Québec</span>, <span class="postal-code">H2R 2W3</span> <span class="country-name">Canada</span> </div> Téléphone : <span class="tel">(514) 948-6644 ou 1-877-948-6644 (sans frais) </span> <br /> Télécopieur : <span class="fax">(514) 948-3320 </span> <br /> Adresse électronique : <a class="email" href="mailto:[email protected]">[email protected]</a> </p></div>
<div id="" class="vcard"> <div class="org"> <p> <a class="url fn n" href="http://www.communautique.qc.ca">Communautique </a> est situé au : </p> </div> <div class="adr"> <div class="street-address"> 65 De Castelnau Ouest, suite 202 </div> <span class="locality">Montréal</span>, <span class="region">Québec</span>, <span class="postal-code">H2R 2W3</span> <span class="country-name">Canada</span> </div> Téléphone : <span class="tel">(514) 948-6644 ou 1-877-948-6644 (sans frais) </span> <br /> Télécopieur : <span class="fax">(514) 948-3320 </span> <br /> Adresse électronique : <a class="email" href="mailto:[email protected]">[email protected]</a> </p></div>
Les données sont reconnues et
réutilisables
Boîte à outils du web sémantique
Connues… mais pas toujours bien utilisées(X)HTML valideAttributs class et idBalise meta -> métadonnées
Mais aussiRDF, RDFaOWL, SPARQL, SKOS, GRRDLmicroformats
Boîte à outils du web sémantique
Exemples de vocabulaires, d’ontologies :
• OpenCyc -> ontologie générale
• Dublin Core -> ressources numériques• FOAF -> relations entre personnes• SIOC -> réseaux sociaux
• microformats : hCard, hEvent, hResume, etc.
Pour faire quoi?
• Meilleure recherche• Exploration des données de sources diverses
• Construction de corpus de données
• Bonification des contenus• Réutilisation et partage
Recherche sémantique
• Ça commence – Yahoo SearchMonkey– Google Rich Snippets– Google Squared– Sindice
Exploration des données
sur le web• Harper’s Index : – Exploitation d’un corpus
• DBpedia : – Wikipedia sémantisé comme base de connaissnces
• Freebase : – Collection de corpus
• BBC Music : – Services intégrés
Construction de sites
• Semantic MediaWiki
• CMS et RDF : – Drupal– WordPress
Bonification des contenus
• Open Calais/Faviki : – Ajouter des liens dans mes contenus vers le web
• Common Tags/MOAT : – Préciser le sens des mots clés
Réutilisation et partage
Le mouvement « Open Data »• LOD : Linked Open Data
Initiatives des gouvernements• Data.gov (ThisWeKnow)• Data.gov.uk• SEMIC.eu
Comment faire le saut?
• Profiter des structures existantes– HTML, gabarits, bases de données
• Utiliser des vocabulaires existants– Sinon rendre son vocabulaire public
• Utiliser des convertisseurs et des librairies– « rdfizer », « triplifier »
• Commencer petit!
Merci!