universität zu köln 17.07.2009 it zertifikat phil. fak: daten- und metadatenstandards ss 2009 ma:...

25
Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle „RDF in 5 Minuten“* „RDF in 5 Minuten*“ Resource Description Framework Referent: Daniel Feith

Upload: amelinda-zeinert

Post on 05-Apr-2015

103 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten“*

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Page 2: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Erläuterung

Geschichte

Modell

Beispiel

Weiterer Syntax

Fazit

Quellen

/Übersicht

Page 3: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Was ist RDF?

/Erläuterung

• Resource Description Framework: „System zur Beschreibung von Ressourcen“ (Standard des W3C)

• dient zur formalen Beschreibung von Informationen über Objekte (Ressourcen), die durch eindeutige Bezeichner (URIs) identifiziert werden.

• hat ein Datenmodell zur Beschreibung von Metadaten im WWW wie z.B. Titel, Autor oder Copyright einer Webseite

• RDF ist eine Kernkomponente des semantischen Webs

Page 4: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Was ist RDF?

/Erläuterung

• Wichtigster Unterschied zu anderen Meta-Auszeichnungssprachen wie z.B. Dublin-Core:

Mit RDF ausgezeichnete Informationen sind nicht nur maschinell lesbar sondern auch interpretierbar. Nur implizit enthaltene Informationen können maschinell abgeleitet und erschlossen werden!

z.B. mithilfe von RDF-Schema (RDFS) oder der Web Ontology Language (OWL)

• RDF besitzt ein einfaches Datenmodell: Daten werden als wahre Aussagen zu einem Tripel modelliert.

Page 5: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Implizite Information aufschlüsseln?

/Erläuterung

• Was bedeutet das in der Praxis? Was sind semantische Informationen?

• Die Grafik zeigt eine Beziehungswirkung zwischen 3 unterschiedlichen Ressourcen. Tier, Fleisch- und Pflanzenfresser.

Page 6: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Semantische Information

/Erläuterung

• Das Schaubild zeigt also sowohl Fleisch- als auch Pflanzenfresser sind Tiere. Nehmen wir nun an, irgendwo wäre semantisch die Tatsache hinterlegt, dass Tiere aus „Fleisch“ bestehen.

In RDF ausgezeichnete Ressourcen würden dann nicht explizit Informationen benötigen das ein Carnivore einen Herbivoren fressen könnte. Diese implizite Information würde aus den Daten abgeleitet werden können (Herbivore besteht aus Fleisch, Carnivore frisst Fleisch) .

• Ein Herbivore wäre somit maschinell als potentielles Beutetier identifizierbar ohne das dies ausdrücklich erwähnt wird.

Page 7: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Nutzen?

/Erläuterung

• Die komplette maschineninterpretierbare Umsetzung des jetzigen WWW zum Semantic Web hätte unmittelbare Auswirkung auf die Nutzbarkeit von Informationen

• Derzeit z.B. müsste man – würde man z.B. den günstigsten Flug zu einem Reiseziel suchen – diverse manuelle Suchanfragen starten und würde doch nur einen kleinen Teil des Webs erreichen.

• Ein vollständig semantisch erschlossenes Web bietet den Vorteil, dass ich eine Maschine mit der Suche beauftragen kann. „Buche den günstigsten Flug Economy Class nach XYZ irgendwann in den Sommerferien, bei einem Abflugsort in meiner Nähe... Aber nur bei gutem Wetter!“

Page 8: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Nutzen?

/Erläuterung

• Der Suchagent (Maschine) müsste also erstmal verstehen was ich (der Mensch) von ihm möchte.

- er müsste die Preise und Leistungen der Flugesellschaften Vergleichen können - er müsste das Ziel eindeutig identifizieren können - er müsste wissen welcher Zeitraum „Sommerferien“ ist - er müsste Geodaten vergleichen können. - er müsste für den Zeitraum Wetterprognosen einholen und Auswerten können

• All dies wäre zukünftig mit einem semantisch erschlossenen Web möglich

Page 9: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Geschichtliches

/Geschichte

• Als Vorläufer von RDF kann das Meta Content Framework (MCF) in XML gelten. 1995–1997 von R. V. Guha entwickelt

• später entschloss man sich beim W3C eine allgemeine Sprache zur Formulierung von Metadaten zu entwickeln, die den Namen RDF tragen sollte.

• Der erste RDF-Standard wurde im August 1997 als Entwurf vorgelegt und im Februar 1998 als Empfehlung veröffentlicht. Eine Überarbeitung des Entwurfes wurde 2004 fertiggestellt.

• Ab 1999 wurde mit der Entwicklung von RDF-Schema begonnen.

Page 10: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Modell

/Modell

• Datenmodell != Repräsentationsformat für RDF-Daten!

RDF-Daten können in dem vom W3C spezifizierten XML-Format RDF/XML serialisiert werden. Leider wird dies oftmals irreführend einfach nur als „RDF“ bezeichnet obwohl nicht das Datenmodell an sich sondern das XML-Format im allgemeinen gemeint ist..

• RDF-Daten können ebenso in für Menschen lesbareren Formaten wie Notation 3 (auch N3 oder RDF/N3) repräsentiert werden.

• RDF-Graphen können auch in speziellen Datenbanken, den sogenannten Triplestores gespeichert werden.

Damit lassen sich auch große RDF-Graphen verwalten, durch spezielle Anfragesprachen wie SPARQL durchsuchen und in Anwendungen nutzen.

Page 11: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Modell

/Modell

• Ein grundlegender Begriff in RDF ist die Ressource.

Eine Ressource ist alles was durch einen eindeutigen Bezeichner im URI-Format benannt wird. (URI = Uniform Resource Identifier)

• Eine Ressource kann eine Webseite sein, die durch eine URL eindeutig identifiziert wird.

Es können aber auch z.B. E-Mail-Accounts, Bücher und generelle Konzepte mit URIs und einem speziellen RDF-Tag identifiziert werden.

• Die zugrundeliegende Struktur eines jeden RDF-Ausdrucks ist eine Sammlung von Tripeln (sog. RDF-Tripel)

Diese RDF-Tripel bestehen immer aus einem „Subjekt“, einem „Prädikat“ (oder „Eigenschaft“) und einem „Objekt“ (oder „Eigenschaftswert“).

Page 12: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Modell

/Modell

• Eine Menge solcher RDF-Tripel wird zusammengefasst Unter dem begriff „RDF-Graph“.

• Ein Tripel ist eine Aussage, dass eine Beziehung zwischen dem Subjekt und dem Objekt besteht. Diese Beziehung ist gerichtet, nämlich vom Subjekt zum Objekt, und mit dem Prädikat benannt. Ein Prädikat stellt also eine binäre Relation dar.

• Subjekt und Prädikat sind immer Ressourcen. Das Objekt kann entweder eine Ressource oder ein Literal sein. Literale sind dabei Zeichenketten, die unter Umständen noch anhand eines angegebenen Datentyps interpretiert werden

Page 13: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Modell

/Modell

• Kleines Beispiel zum Verständnis:

• Gegeben ist ein Dokument , also eine Ressource - z.B. die Übersichtsseite zur heutigen Sitzung:

http://www.hki.uni-koeln.de/dogsbody_display_course/45/530/1 Im folgenden unser Subjekt. • Das Dokument hat folgenden (fiktiv gewählten) Titel:

„HKI IT Zertifikat Phil. Fak: Lingua Franca für Daten: XML (and friends)“

Die Aussage „Titel vorhanden“ bildet das Prädikat, das Literal bzw. der Text-String des Titels das entsprechende Objekt.

Page 14: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Modell

/Modell

• zum anderen nehmen wir an, dass besagte Ressource auch einen Herausgeber hat:

z.B. „Universität zu Köln“

• auch hier ist die Aussage „es gibt einen Herausgeber“ ein Prädikat und der entsprechende Wert/Value/Text (das Literal) das zugehörige Objekt.

• Das bedeutet, dass ein und die selbe Ressource verschiedene auf diese bezogene Tripel vorweisen kann. also z.B. Titel, Herausgeber, Erscheinungsjahr etc. - so wie bei anderen Meta-Formaten sonst auch üblich.

Page 15: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Beispiel

/Beispiel

• wir haben also:

- Eine Ressource: „http://www.hki.uni-koeln.de/dogsbody...“

- Ein Titel mit dem Wert: „HKI IT Zertifikat Phil. Fak...“

Pseudo-Code: <title>HKI IT Zertifikat Phil. Fak... </title>

- Ein Herausgeber (Publisher) mit dem Wert: „Universität zu Köln“

Pseudo-Code: <publisher>Universität zu Köln</publisher>

Aber wie sieht das formal korrekt aus?

Page 16: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Beispiel

/Beispiel

Nochmal zur Übersicht, wir haben 2 Tripel:

• http://www.w3.org/RDF/Validator/

Page 17: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Beispiel

/Beispiel

<?xml version="1.0" encoding="UTF-8" ?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc="http://purl.org/dc/elements/1.1/">

Der obere Block besagt hierbei: Diese Datei ist eine XML Datei mit RDF-Syntax und dem xml-Namensraum: DC

Der eigentliche Kern der Bescheibung beginnt ab hier:

<rdf:Description rdf:about="http://www.hki.uni-koeln.de/dogsbody_display_course/45/530/1">

<dc:title>HKI IT Zertifikat Phil. Fak: Lingua Franca für Daten: XML (and friends)</dc:title><dc:publisher>Universität zu Köln</dc:publisher>

</rdf:Description>

</rdf:RDF>

Page 18: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Beispiel

/Beispiel

<rdf:Description rdf:about="http://www.hki.uni-koeln.de/dogsbody_display_course/40/467/0">

RDF Beschreibung über (about) folgende Ressource.

<dc:title>HKI IT Zertifikat Phil. Fak: Dedizierte Systeme: Fedora und RDF</dc:title>

Die Aussage „es gibt einen Titel“ wird nach Dublin-Core ausgezeichnet

<dc:publisher>Universität zu Köln</dc:publisher>

Ebenso die Aussage „es gibt einen Herausgeber“

</rdf:Description>

</rdf:RDF>

Page 19: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Beispiel

/Beispiel

• der Graph dieser Aussage lässt sich wie folgt darstellen:

• Wo wurde im Quelltext das Prädikat wie im Graph oben angegeben?

• http://purl.org/dc/elements/1.1/title ? Wurde implizit bei der Angabe des Namensraums zugewiesen. => <dc:title>

Page 20: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Weiterer Syntax

/weiterer Syntax

• RDF wird zwar häufig als XML-Dateiform angegeben, dennoch gibt es noch andere Aussageformen, z.B.:

- das vom Menschen besser lesbare N3 und - Datenbank Statements mit RDQL (RDF Data Query Language)

• N3:

<http://www.hki.uni-koeln.de/dogsbody_display_course/40/467/0> has <http://purl.org/dc/elements/1.1/title> "HKI IT Zertifikat Phil. Fak: Lingua Franca.. .

Page 21: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Weiterer Syntax

/weiterer Syntax

• RDQL: SELECT ?title

WHERE (?res, <dc:publisher>, ?pub), (?res, <dc:title>, ?title)

AND ?pub eq 'HKI IT Zertifikat Phil. Fak: Lingua Franca...'

USING rdf for <http://www.w3.org/1999/02/22-rdf-syntax-ns#>, dc for <http://purl.org/dc/elements/1.1/>

Page 22: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Fazit

/Fazit und Fragen

• RDF ist eine „Meta-Auszeichnungssprache“ die die Bildung von semantischen Informationen ermöglicht und diese als RDF- Datenformaten maschinell auswertbar bereitstellen kann.

Dadurch ergeben sich Informationsmehrwerte.

Fragen?

Page 23: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Vielen Dank für die Aufmerksamkeit

/Danksagung

Page 24: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

Quellen

/Quellen

RDF

• http://de.wikipedia.org/wiki/Resource_Description_Framework• http://www.w3.org/RDF/• http://www.w3.org/TR/REC-rdf-syntax/• http://www.w3schools.com/rdf/default.asp• http://www.xml.com/pub/a/2001/01/24/rdf.html• http://www.w3.org/RDF/Validator/

Page 25: Universität zu Köln 17.07.2009 IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009 MA: Patrick Sahle RDF in 5 Minuten* RDF in 5 Minuten* Resource

Universität zu Köln17.07.2009

IT Zertifikat Phil. Fak: Daten- und Metadatenstandards SS 2009

MA: Patrick Sahle

„RDF in 5 Minuten*“Resource Description Framework

Referent: Daniel Feith

* nach der sahlschen Referenzuhr

/Schlusswort