Zum Inhalt springen

SEO Analyse » SEO Lexikon » r » RDF

RDFRDF ist die Abkürzung für Resource Description Framework. RDF wird sinngemäß mit „System, welches zur Darstellung von Ressourcen genutzt wird“, übersetzt. Bei RDF handelt es sich um eine rein technische Umsetzung. Diese Herangehensweise über RDF wird im Internet verwendet. Eingesetzt wird RDF, um logische Aussagen über beliebige Sachen, also über Ressourcen zu formulieren. RDF wurde vom Ursprung her durch das World Wide Web Consortium, kurz W3C als ein Standard entwickelt, um Metadaten zu beschreiben. RDF wird mittlerweile jedoch als ein grundlegender Bestandteil innerhalb des semantischen Webs angesehen. Dabei ähnelt RDF den klassischen Methoden, mit welchen Konzepte wie es bei UML-Klassendiagrammen oder Entity-Relationship-Modellen der Fall ist, gestaltet wurden. Bei dem RDF-Modell wird jede Aussage aus drei Einheiten formuliert. Die drei Einheiten, welche in RDF immer enthalten sind, sind das Subjekt, das Prädikat und das Objekt. Hierbei wird eine Ressource als das Subjekt durch die andere Ressource als Prädikat umfassender und genauer beschrieben. Das Objekt wird bei RDF durch eine weitere Ressource oder auch durch einen weiteren Wert gebildet. Diese drei Einheiten bilden bei RDF ein Tripel. Dieses Tripel wird auch 3-Tupel genannt. Damit die Ressourcen eindeutige Bezeichner erhalten, werden diese nach Konventionen, wie es beispielsweise bei URLs der Fall ist, formuliert. Den RDF-Entwicklern sind die am häufigsten genutzten URLs, wie sie beispielsweise für Metadaten genutzt werden, bekannt. So können diese URLs weltweit für dieselben Zwecke eingesetzt und genutzt werden. So können die Programme die Daten für die Menschen lesbar und verwertbar darstellen.

Eine Skizze des RDF-Modells

Bei einem RDF-Modell handelt es sich um ein Datenmodell. Dieses Datenmodell verfügt über eine wohldefinierte formale Semantik. Diese basiert immer auf gerichteten Graphen. Die Daten, die in RDF verwendet werden, sind Aussagen über die Ressourcen. Dabei werden diese Aussagen in RDF als Tripel modelliert. Die Menge aller Tripel in RDF bilden einen mathematischen Graphen. Dieser Graph wird auch als RDF-Modell bezeichnet. Bei einem Tripel handelt es sich in RDF um eine Elementaraussage. Diese Elementaraussage setzt sich in RDF immer aus Subjekt, Prädikat und Objekt zusammen. So kann das Tripel beispielsweise eine Behauptung darstellen. Innerhalb dieser Behauptung werden das Subjekt und das Objekt in Relation zueinander, also miteinander in Beziehung, gesetzt. Diese Beziehungen sind beim RDF-Modell immer vom Subjekt hin zu einem Objekt gerichtet. Sie werden durch das dazugehörige Prädikat benannt. Die Tripel, welche sich auf die gleichen Subjekte oder auch die gleichen Objekte beziehen. Diese stellen zusammen ein semantisches Netz dar. Dieses Netz wird nicht selten grafisch oder auch tabellarisch dargestellt. Umgangssprachlich betrachtet handelt es sich bei jeder Darstellung über RDF um einen einfachen Satz wie „ANS produziert Bänke“. In RDF übertragen ist ANS das Subjekt, produziert das Prädikat und die Bänke stellen das Objekt dar. Diese Aussage kann um weitere, folgende Aussagen ergänzt werden. Dabei wird durch jede Zeile, also jede Aussage ein Tipel gebildet. Jedes einzelne der Tripel bestehend aus einem Subjekt, einem Prädikat und auch aus einem Objekt.

Literal, die Ressourcen und URI in RDF

In RDF werden Ressourcen als eindeutige Begriffe angesehen, die immer für eine bestimmte Sache stehen. Diese Begriffe stehen immer für das, worüber eine Aussage getroffen werden soll. Dabei sind in RDF das Subjekt, das Objekt und das Prädikat immer Ressourcen. Dabei kann das Objekt entweder lediglich ein Literal darstellen oder auch eine Ressource sein. Bei den Literalen handelt es sich um Zeichenketten. Diese Zeichenketten können unter Umständen interpretiert werden. Diese Interpretation erfolgt anhand von einem angegebenen Datentyp. Zahlen, Wahrheitswerte oder auch Datumsangaben können als Literale spezifiziert werden. Die Ressourcen in RDF-Ressourcen werden immer durch die URIs, die eindeutigen Bezeichner, identifiziert. Durch die URIs können die Aussagen aus den verschiedenen Quellen miteinander verbunden werden. Die Ressourcen, welche formal den URLs ähneln, werden häufig durch eine URI bezeichnet. Bei den URLs handelt es sich um spezielle URIs. Diese dienen dazu, die Webseites zu bezeichnen. Die URIs müssen hierbei nicht zwangsläufig innerhalb des Netzwerks erreichbar sein. Die Ressourcen, welche als Prädikat verwendet werden, können als RDF-Aussagen getroffen werden. Zudem können diese Ressourcen als Metadatenformat abgelegt werden. Dadurch können die anderen RDF-Autoren die Vokabulare durch eine Referenzierung wieder verwenden. So ist es beispielsweise beim Dublin Core, welches in RDF programmiert wurde, der Fall. Die RDF-Statements bilden hier auf der anderen Seite selbst Ressourcen. Diese Ressourcen oder RDF-Statements können wiederum mit anderen Aussagen relegiert werden. Werden Aussagen über bereits getroffene Aussagen gemacht, wird dies in der Technik als eine Reifikation bezeichnet. In RDF gibt es vordefinierte Datentypen, welche für Listen oder Mengen bereitstehen mit dem Ziel die Gruppen, welche die verschiedenen Ressourcen beinhalten, zusammenzufügen. Dabei werden die Ressourcen, welche über keine explizite URI verfügen, sondern lediglich zur Gruppierung der anderen Objekte stehen, durch „black nodes“ gestaltet. Das geschieht beispielsweise durch die Zuweisung von einem Namen, welcher aus gesonderten Zeichenketten sowohl für den Vornamen als auch für den Nachnamen besteht.

Die Repräsentation von RDF

RDF wird immer ohne einen direkten Zusammenhang mit einer textuellen Repräsentation verwendet. Üblicherweise wird XML verwendet. Aber auch kürzere Syntax wie Notation 3, kurz N3 finden Einsatz zur Repräsentation von RDF. Durch W3C wurde während des Jahres 2011 die Sprache Turtle erstellt und genau definiert. Hierbei handelt es sich um einen Auszug von N3. Hier werden Elemente von N3 verwendet, ohne dass das ganze Programm zur Anwendung kommt. Turtle soll so als abgespeckte Version von N3 für eine größere Verbreitung sorgen. Damit RDF in den verschiedenen Datenstrukturen oder auch in den Datenbanken gespeichert werden kann, werden Triplestores benötigt. Bei den Triplestores handelt es sich um verschiedenartige Konzepte zur Speicherung von RDF. Diese Triplestores existieren, da das reine Ablegen von Tripeln in relationalen Tabellen für häufige Abrufe nicht effizient und schnell genug ist. Die Tripel von RDF werden aber auch grafisch dargestellt. Nach den vorhandenen Konventionen werden die Ressourcen, welche das Subjekt oder das Objekt von einem Tripel sind, in Form von Ellipsen dargestellt. Die Literale werden durch Rechtecke dargestellt. In RDF werden die Verbindungen zwischen Subjekt und Objekt mithilfe einer gerichteten Kante, welche durch das Prädikat markiert wurde, dargestellt.

Die Möglichkeiten der Abfragen in RDF

Damit in den RDF-Daten Suchen durchgeführt werden können, wurden hierfür verschiedene Abfragesprachen entwickelt. Bei der RDF Quere Language, kurz RDQL handelt es sich um eine Abfragesprache, die ihrer Form nach an SQL erinnert. Das SPARQL von W3C wurde als Recommendation durch W3C im Januar 2008 verabschiedet. SPARQL wurde somit zum Standard der RDF-Anfragesprachen. Daher gibt es gerade für SPARQL sehr viele Implementierungen.

Die Geschichte von RDF von 1995 bis heute

Von 1995 bis 1997 wurde durch Ramanathan V. Guha der Vorläufer vom heutigen RDF entworfen. Es handelte sich dabei um das Meta Content Framework. Die Kurzbezeichnung ist hier MCF. Hierbei handelt es sich um eine Sprache, welche durch Guha, nachdem er im Jahr 1997 zu Nescape gewechselt hatte, beim W3C einreichte. Meta Content Framework war auch eine der Reaktionen auf das von Microsoft veröffentlichte Channel Definition im Rahmen der stattfindenden Browserkriege. Jedoch entschlossen sich die Herausgeber zur Entwicklung von einer allgemeinen Sprache, welche die Formulierung von den benötigten Metadaten zulässt. Dabei blieb Meta Content Framework unberücksichtigt. Stattdessen wurde RDF zur allgemeinen Formulierung von Metadaten entwickelt. Bereits im August 1997 wurde der erste Entwurf für einen RDF-Standard verfasst. Dieser Entwurf wurde zu Beginn des Jahres 1999 in Form von einer Empfehlung veröffentlicht. Im gleichen Jahr startete die Entwicklung eines RDF-Schemas, aus dem das heutige RDF entstand.

Zusammenfassung

RDF (Resource Description Framework) ist ein technisches System zur Beschreibung von Ressourcen im Internet, entwickelt vom World Wide Web Consortium (W3C). Es formuliert logische Aussagen in Form von Tripeln, die aus Subjekt, Prädikat und Objekt bestehen. Das RDF-Modell ist ein Grundpfeiler des semantischen Webs und basiert auf gerichteten Graphen.

Die einzelnen Elemente in RDF sind als Ressourcen bekannt und durch eindeutige URIs identifiziert. Literale, spezielle Arten von Ressourcen, können Datentypen wie Zahlen oder Wahrheitswerte enthalten. RDF nutzt vordefinierte Datentypen und ermöglicht die Gruppierung von Ressourcen durch spezielle Elemente, die als „black nodes“ bezeichnet werden.

Textlich wird RDF häufig in XML repräsentiert, jedoch existieren auch andere Formate wie Notation 3 (N3) oder Turtle. Für die Speicherung von RDF-Daten werden spezialisierte Datenbanken namens Triplestores genutzt.

Abfragen in RDF können mit verschiedenen Abfragesprachen durchgeführt werden, wobei SPARQL der von W3C empfohlene Standard ist.

Der Vorläufer von RDF wurde zwischen 1995 und 1997 als Meta Content Framework entwickelt. Die erste Version des RDF-Standards wurde 1999 veröffentlicht und hat sich seitdem als zentrales Element für die Beschreibung von Metadaten etabliert.

Häufige Fragen und Antworten

Was ist RDF und wofür wird es verwendet?

RDF (Resource Description Framework) ist ein technisches System zur Beschreibung von Ressourcen im Internet. Es wird verwendet, um logische Aussagen über Ressourcen zu formulieren. RDF dient zur Darstellung von Metadaten und ist ein grundlegender Bestandteil des semantischen Webs.

Wie werden Ressourcen in RDF identifiziert?

Ressourcen in RDF werden durch eindeutige Bezeichner, sogenannte URIs (Uniform Resource Identifiers), identifiziert. Diese URIs dienen dazu, Aussagen aus verschiedenen Quellen miteinander zu verbinden und weltweit einheitlich zu nutzen.

Wie werden Aussagen in RDF formuliert?

Aussagen in RDF werden als Tripel formuliert, die aus drei Einheiten bestehen: dem Subjekt, dem Prädikat und dem Objekt. Das Subjekt beschreibt eine Ressource genauer, das Prädikat gibt die Beziehung zum Objekt an. Das Objekt kann eine weitere Ressource oder ein Wert sein.

Bildnachweis: iStock.com/D3Damon


Zurück zur Hauptseite: r
Alle Marken, Warenzeichen, Unternehmens- und Produkt-Bezeichnungen sind mit, aber auch ohne definitive Kennzeichnung, Eigentum des Inhabers der Rechte. Alle aufgeführten Elemente dienen lediglich der informativen Beschreibung.