DCMI-Abstraktmodell - Übersetzungsentwurf
WICHTIG: Dieses Dokument und die damit verbundenen UML-Diagramme sind Entwürfe, die in der Email-Liste dc-architecture@jiscmail.ac.uk weiterdiskutiert werden. Kommentare dazu sollen bitte an diese Liste gehen. Dieses Dokument ist eine Übersetzung von http://dublincore.org/documents/2007/02/05/abstract-model/.
Siehe AbstractModelChanges für eine Liste wichtiger Änderungen im Vergleich zum derzeit geltenden Dokument mit dem Status "DCMI Recommendation".
1. Einführung
Dieses Dokument beschreibt ein Abstraktmodell für Dublin-Core-Metadaten ("DCMI Abstract Model", kurz "DCAM"). Primärer Zweck des Dokuments ist es, die Komponenten und Konstruktionen, die in Dublin-Core-Metadaten verwendet werden, zu spezifizieren. Dieses Dokument definiert die verwendeten Komponenten und beschreibt, wie diese Komponenten miteinander kombiniert werden, um Informationsstrukturen zu bilden. Das DCMI-Abstraktmodell" ist ein von jeglicher besonderen Codierungssyntax unabhängiges Referenzmodell. Ein derartiges Referenzmodell hilft damit, die Beschreibungen, die wir codieren wollen, besser zu verstehen und ermöglicht somit bessere Abbildungen und bessere, syntaxübergreifende Datenkonvertierungen.
Dieses Dokument richtet sich in erster Linie an Entwickler von Softwareanwendungen, die Dublin-Core-Metadaten unterstützen, an Verfasser neuer syntaktischer Codierungsrichtlinien für Dublin-Core-Metadaten und an Autoren von Dublin-Core-basierten Anwendungenprofilen.
Das DCMI-Abstraktmodell baut auf der Arbeit des World Wide Web Consortium (W3C) am Resource Description Framework auf (RDF). Die Verwendung von Konzepten aus RDF wird unten im Abschnitt 5 (Semantik des DCMI-Abstraktmodells) zusammengefasst.
Das DCMI-Abstraktmodell wird hier mit UML-Klassen-Diagrammen dargestellt [UML]. Für Leser, die solche UML-Klassen-Diagramme nicht kennen, eine kurze Anleitung: Linien, die in einem Maßpfeil enden, werden als 'ist' oder 'ist eine' gelesen (z.B. "ein Wert ist eine Ressource"). Linien, die mit einer Raute beginnen, werden als 'hat' oder 'hat eine' gelesen (z.B. "eine Aussage hat einen URI der Eigenschaft"). Andere Beziehungen werden entsprechend etikettiert. Es sei weiter erwähnt, daß die UML-Modellierung in diesem Dokument das Abstraktmodell zwar abbildet, aber nicht als geeignete Basis für die Entwicklung von Softwareanwendungen verstanden werden soll. Die kursiv geschriebenen Wörter und Phrasen in diesem Dokument werden im Abschnitt "Terminologie" definiert.
2. DCMI-Abstraktmodell
Das Abstraktmodell der Ressourcen, die von Beschreibungen beschrieben werden, lautet wie folgt:
-
Jede beschriebene Ressource kann mittels eines oder mehrerer Eigenschaft/Wert-Paare beschrieben werden.
-
Jedes Eigenschaft/Wert-Paar besteht aus einer Eigenschaft und einem Wert.
-
Jeder Wert ist eine Ressource - die physische oder begriffliche Entität, die mit einer Eigenschaft assoziiert wird, wenn die Eigenschaft benutzt wird, eine Ressource zu beschreiben.
![]() |
| Diagramm 1 - das DCMI-Ressourcenmodell |
Das Abstraktmodell der Beschreibungen lautet wie folgt:
-
Ein Beschreibungssatz besteht aus einer oder mehreren Beschreibungen, von denen jede eine einzige Ressource beschreibt.
-
Eine Beschreibung besteht aus einer oder mehreren Aussagen (bezüglich einer, und nur einer, beschriebenen Ressource) und Null oder einem URI der Ressource - einem URI, der die beschriebene Ressource identifiziert.
-
Jede Aussage instanziiert ein Eigenschaft/Wert-Paar und besteht aus einem URI der Eigenschaft (einem URI, der eine Eigenschaft identifiziert), Null oder einem URI des Werts (einem URI, der den Wert, der mit einer Eigenschaft assoziiert ist, identifiziert), Null oder einem URI des Semantischen Codierungsschemas (einem URI, der das Semantische Codierungsschema, dem der Wert angehört, identifiziert), und Null oder mehreren Wertrepräsentationen.
-
Die Wertrepräsentation kann die Form eines Wertstrings oder die einer erweiterten Repräsentation annehmen.
-
Jede Werte-Zeichenkette ist eine Zeichenkette, der die Ressource repräsentiert. Eine Werte-Zeichenkette soll menschenlesbar sein.
-
Jede Werte-Zeichenkette kann entweder mit einem URI des Syntax-Kodierungsschemas, der ein Syntax-Kodierungsschema identifiziert, oder mit einer Wertstringsprache (d.h. einer ISO-normierten Sprachangabe wie etwa "de" oder "en-GB"), assoziiert werden, aber nicht mit beiden zugleich.
-
Jede erweiterte Repräsentation ist eine Sequenz von Oktetten, die den Wert (eine Ressource) repräsentiert -- z.B. einen Text mit Auszeichnungen, ein Bild, ein Film, Audioinhalt, oder eine Kombination von diesen.
-
Jede erweiterte Repräsentation muss einen entsprechenden Media-Typ (einen MIME-Media-Typ) haben.
![]() |
| Diagramm 2 - das DCMI-Beschreibungsmodell |
Das Abstraktmodell der Vokabulare, die in Beschreibungen verwendet werden, lautet wie folgt:
-
Jede Eigenschaft kann einer oder mehreren Klassen gegenüber in einer hat Domäne-Beziehung stehen. Wo deklariert wird, daß eine Eigenschaft eine derartige Beziehung mit einer Klasse hat und daß eine beschriebene Ressource mit dem Wert mittels derjenigen Eigenschaft assoziiert ist, folgt, daß die beschriebene Ressource eine Instanz jener Klasse ist.
-
Jede Eigenschaft kann einer oder mehreren Klassen gegenüber in einer hat Range-Beziehung stehen. Wo deklariert wird, daß eine Eigenschaft eine derartige Beziehung mit einer Klasse hat und eine beschriebene Ressource mit dem Wert mittels derjenigen Eigenschaft assoziiert ist, folgt, daß der Wert eine Instanz jener Klasse ist.
-
Jede Ressource kann eine Instanz von (instance of) einer oder mehreren Klassen sein.
-
Jede Ressource kann einem oder mehreren Semantischen Codierungsschemas angehören (Mitglied von).
-
Jede Klasse kann sich auf eine oder mehrere Klassen mittels einer sub-class-of-Beziehung beziehen, wobei die zwei Klassen derartig definiert sind, daß alle Ressourcen, die Instanzen der Subklasse sind, zugleich auch Instanzen der entsprechenden Klasse sind.
-
Jede Eigenschaft kann sich auf eine oder mehrere Eigenschaften mittels einer sub-property-of-Beziehung beziehen. Wo deklariert wird, daß eine derartige Beziehung existiert, sind die zwei Eigenschaften derartig definiert, daß wenn eine Ressource mit dem Wert mittels derjenigen Untereigenschaft assoziiert ist, folgt, daß die Ressource sich auch auf den gleichen Wert mittels der Eigenschaft bezieht.
-
Jedes Syntax-Kodierungsschema ist eine Klasse (von Zeichenketten).
-
Ein Vokabular ist ein Satz von einem oder mehreren Termen. Jeder Term ist Mitglied eines oder mehreren Vokabularen.
![]() |
| Diagramm 3 - das DCMI-Vokabularmodell |
Einige Bemerkungen:
-
Jeder Wert kann die beschriebene Ressource einer separaten Beschreibung innerhalb des gleichen Beschreibungssatzes sein. Eine separate Beschreibung kann zum Beispiel Metadaten über die Person, die die beschriebene Ressource verfasst hat, mitteilen.
-
Das Beschreibungsmodell hat keinen expliziten Mechanismus dafür, die Klassen der beschriebenen Ressource oder die Klassen eines gegebenen Wertes zu bezeichnen. Die Klassen der beschriebenen Ressource können entweder explizit durch eine oder mehrere Aussagen in der Beschreibung bezeichnet werden oder implizit anhand der Domains der Eigenschaften, die in der Beschreibung verwendet werden, abgeleitet werden. Klassen eines gegebenen Wertes können entweder explizit durch eine oder mehrere Aussagen in einer separaten Beschreibung über jenen Wert bezeichnet werden oder implizit anhand vom Range der entsprechenden Eigenschaft abgeleitet werden.
3. Beschreibungen, Beschreibungssätze und Metadatensätze
Im vorliegenden Abstraktmodell beschreibt jede Beschreibung eine, und nur eine Ressource. Das Prinzip wird "Eins-zu-Eins-Prinzip" ("one-to-one principle") genannt.
Metadatenanwendungen basieren jedoch typischerweise auf locker gruppierten Sätzen von Beschreibungen in denen die beschriebenen Ressourcen typischerweise miteinander verwandt sind -- hier Beschreibungssätze genannt. Ein Beschreibungssatz kann beispielsweise die Beschreibungen sowohl von einem Bild als auch von dessen Maler beinhalten. Es kommt ausserdem oft vor, daß ein Beschreibungssatz auch eine Beschreibung des Beschreibungssatzes selbst beinhaltet, was manchmal "administrative Metadaten" oder "meta-Metadaten" genannt wird.
Beschreibungssätze werden zwecks Austausch zwischen Softwareanwendungen in Form von Metadatensätzen gemäss DCMI-Codierungs-Richtlinien (z.B. für XHTML meta tags, XML und RDF/XML) instanziiert [DCMI-ENCODINGS].
4. Werte
Ein Wert ist die physische oder begriffliche Entität, die mit einer Eigenschaft assoziiert wird, wenn die Eigenschaft zur Beschreibung einer Ressource verwendet wird. Ein Wert, der mit der Dublin Core-Eigenschaft Creator assoziiert wird, ist beispielsweise eine Person, Organisation oder Dienst - eine physische Entität. Ein Wert, der mit der Dublin Core-Eigenschaft Date assoziiert wird, ist ein Punkt (oder Intervall) der Zeit - eine begriffliche Entität. Ein Wert, der mit der Dublin Core-Eigenschaft Coverage assoziiert wird, ist ein geographisches Gebiet oder Land - eine physische Entität. Ein Wert, der mit der Dublin Core-Eigenschaft Subject assoziiert wird, ist ein Begriff (eine begriffliche Entität) oder ein physisches Objekt oder Person (eine physische Entität). Jede dieser Entitäten ist eine Ressource.
Der Wert lässt sich durch einen URI des Werts identifiziern. Der Wert lässt sich durch eine oder mehrere Wert-Zeichenketten und/oder erweiterte Repräsentationen repräsentieren. Der Wert lässt sich durch eine separate Beschreibung beschreiben. In jedem Fall ist der Wert eine Ressource.
5. Semantik des DCMI-Abstraktmodells
Einige der Begriffe des DCMI-Abstraktmodells basieren auf Begriffen des Resource Description Framework (RDF) und RDF Schema (RDFS).
| DCAM | RDF/RDFS |
| resource | rdfs:Resource (eine Klasse) |
| property (element) | rdf:Property (eine Klasse) |
| class | rdfs:Class (eine Klasse) |
| syntax encoding scheme | rdfs:Datatype (eine Klasse) |
| has domain | rdfs:domain (eine Eigenschaft) |
| has range | rdfs:range (eine Eigenschaft) |
| sub-property of | rdfs:subPropertyOf (eine Eigenschaft) |
| sub-class of | rdfs:subClassOf (eine Eigenschaft) |
| Tabelle 1 - DCMI-Abstraktmodell und RDF |
6. Codierungs-Richtlinien
Codierungs-Richtlinien (z.B. für HTML meta tags, XML oder RDF/XML [DCMI-ENCODINGS]) müssen nicht unbedingt alle der oben-beschriebenen Aspekte des Abstraktmodells abbilden. Die Richtlinien müssen jedoch das DCMI-Abstraktmodell zitieren und klar machen, welche Teile des Modells abgebildet werden und welche nicht. Es ist die Rolle von Codierungs-Richtlinien, darzustellen, wie ein Wert auch zugleich als beschriebene Ressource einer separaten Beschreibung in den Fällen funktionieren kann, wo kein Werte-URI vorhanden ist.
7. Terminologie
Dieses Dokument verwendet folgende Begriffe:
Klasse (class)
-
Eine Gruppe, die aus Elementen besteht, die bestimmte Attribute, Verhaltensweisen, Beziehungen oder Semantik gemeinsam haben; eine Art Kategorie.
beschriebene Ressource (described resource)
-
Eine Ressource, die von einer Beschreibung beschrieben wird.
beschriebene Ressource URI (described resource URI)
-
Ein URI, der die beschriebene Ressource identifiziert.
Beschreibung (description)
-
Eine oder mehrere Aussagen bezüglich einer, und nur einer, beschriebenen Ressource.
Beschreibungssatz (description set)
-
Ein Satz von einer oder mehreren Beschreibungen.
Element
-
Ein Synonym für Eigenschaft. Es sei notiert, daß das Wort "Element" gewöhnlich auch für die strukturellen Markup-Bestandteile eines XML-Dokuments verwendet wird.
hat Domäne (has domain) (http://www.w3.org/2000/01/rdf-schema#domain)
-
Eine Beziehung zwischen einer Eigenschaft und einer Klasse, wonach logisch folgt, wenn die beschriebene Ressource mittels jener Eigenschaft mit einem Wert assoziiert wird, daß die beschriebene Ressource eine Instanz jener Klasse ist.
hat Range (has range) (http://www.w3.org/2000/01/rdf-schema#range)
-
Eine Beziehung zwischen einer Eigenschaft und einer Klasse, wonach logisch folgt, wenn die beschriebene Ressource mittels jener Eigenschaft mit einem Wert assoziiert wird, daß der Wert eine Instanz jener Klasse ist.
Instanz von (instance of)
-
Eine Beziehung zwischen einer Ressource und einer Klasse, der eine Klasse, von der die Ressource eine Instanz ist, bezeichnet.
Media-Typ (media type)
-
Ein MIME-Media-Typ (in RFC 2045 und RFC 2046 definiert).
Mitglied von (member of) (http://purl.org/dc/dcam/memberOf)
-
Eine Beziehung zwischen einer Ressource und einem Semantischen Codierungsschema, wonach die Ressource einem Ressourcensatz angehört.
Eigenschaft (property) (http://www.w3.org/1999/02/22-rdf-syntax-ns#Property)
-
Ein spezifischer Aspekt, Charakter, Attribut oder Beziehung, der verwendet wird, Ressourcen zu beschreiben.
URI der Eigenschaft (property URI)
-
Ein URI, der eine einzige Eigenschaft identifiziert.
Eigenschaft/Wert-Paar (property/value pair)
-
Die Kombination einer Eigenschaft mit einem Wert, die für die Beschreibung einer Ressource verwendet wird.
Metadatensatz (record)
-
Eine Instanziierung eines Beschreibungssatzes, die gemäss DCMI-Codierungs-Richtlinien (z.B. für XHTML meta tags, XML oder RDF/XML) erstellt wird.
Ressource (resource) (http;//www.w3.org/2000/01/rdf-schema#Resource)
-
Jede Sache, die identifiziert werden kann. Gängige Beispiele dafür sind ein elektronisches Dokument, eine Abbildung, ein Dienst (z.B., "der heutige Wetterbericht für Los Angeles") oder eine Sammlung anderer Ressourcen. Nicht alle Ressourcen sind unbedingt im Netz abrufbar; Menschen, Firmen, Begriffe und gebundene Bücher in einer Bibliothek können auch als Ressourcen angesehen werden.
erweiterte Repräsentation (rich representation)
-
Eine Sequenz von Oktetten, die einen Wert repräsentiert -- z.B. ein Text mit Auszeichnungen, ein Bild, ein Film, Audioinhalt oder eine Kombination von diesen.
Aussage (statement)
-
Eine Instanziierung eines Eigenschaft/Wert-Paares, die aus einem URI der Eigenschaft (einem URI, der eine Eigenschaft identifiziert), Null oder einem URI des Werts (einem URI, der einen Wert, der mit einer Eigenschaft assoziiert ist, identifiziert), Null oder einem URI des Semantischen Kodierungsschemas (einem URI, der das Semantisches Codierungsschema identifiziert, dem der Wert angehört), und Null oder mehreren Wert-Repräsentationen des Wertes besteht.
Subklasse von (sub-class of) (http://www.w3.org/2000/01/rdf-schema#subClassOf)
-
Eine Beziehung zweier Klassen, in der die zwei Klassen derartig definiert sind, daß alle Ressourcen, die Instanzen der Subklasse sind, auch Instanzen der entsprechenden Klasse sind.
Subeigenschaft von (sub-property of) (http://www.w3.org/2000/01/rdf-schema#subPropertyOf)
-
Eine Beziehung zweier Eigenschaften in der die zwei Eigenschaften derartig definiert sind, daß logisch folgt, wenn die Ressource einem Wert mittels der Subeigenschaft assoziiert ist, daß die Ressource mit jenem Wert auch mittels der Eigenschaft assoziiert ist.
Syntax-Kodierungsschema (syntax encoding scheme) (http://www.w3.org/2000/01/rdf-schema#Datatype)
-
Ein Satz von Zeichenketten und ein entsprechender Satz von Regeln, die eine Abbildung zwischen dem Zeichenkettensatz und einem Satz von Ressourcen beschreibt. Die Abbildungsregeln können bestimmen, wie eine Zeichenkette strukturiert wird (z.B. DCMI Box) oder sie können gegebenenfalls einfach alle Zeichenketten und die entsprechenden Ressourcen auflisten (z.B. ISO 3166).
URI des Syntaktischen Codierungsschemas (syntax encoding scheme URI)
-
Ein URI, der ein Syntax-Kodierungsschema identifiziert.
Term (term)
-
Eine Eigenschaft (oder Element), Klasse, Semantisches Codierungsschema oder Syntax-Kodierungsschema.
Wert (value)
-
Die physische oder begriffliche Entität, die mit einer Eigenschaft assoziiert wird, wenn die Eigenschaft verwendet wird eine Ressource zu beschreiben.
Werte-URI (value URI)
-
Ein URI, der den Wert identifiziert.
Wert-Repräsentation (value representation)
-
Ein Ersatz für den (d.h. eine Repräsentation von dem) Wert.
Werte-Zeichenkette (value string)
-
Eine Zeichenkette, die fakultativ entweder mit einem URI des Syntaktischen Codierungsschema oder mit einer Werte-Zeichenkette-Sprachcode assoziiert wird und die den Wert repräsentiert.
Werte-Zeichenkette-Sprachcode (value string language)
-
Eine ISO-normierte Angabe für die Sprache einer Werte-Zeichenkette.
Semantisches Codierungsschema (vocabulary encoding scheme)
-
Ein gezählter Satz von Ressourcen.
Semantisches Codierungsschema URI (vocabulary encoding scheme URI)
-
Ein URI, der ein Semantisches Codierungsschema identifiziert.
8. Beziehung zu den älteren "DCMI grammatischen Prinzipien"
| Grammatische Prinzipien | DCAM |
| vocabulary term | Ressource |
| element | Eigenschaft oder Element |
| element refinement | Eigenschaft mit sub-property-of-Beziehung |
| encoding scheme | Syntax-Kodierungsschema oder Semantisches Codierungsschema |
| syntax encoding scheme | Syntax-Kodierungsschema |
| vocabulary encoding scheme | Semantisches Codierungsschema |
| qualifier | Eigenschaft mit sub-property-of-Beziehung, Syntax-Kodierungsschema oder Semantisches Codierungsschema |
| Tabelle 2 - Grammatische Prinzipien und DCMI-Abstraktmodell |
Zur Übersetzung
Richtlinien für die übersetzung von DCAM:
-
1. _Alles_ ins deutsch übersetzen
-
2. So nah wie möglich an Englisch plus Fußnoten
-
3. Jedes deutsche Wort erklären, den englischen Term dazu
Änderungen, 2007-02-14
-
Update auf Basis von http://dublincore.org/documents/2007/02/05/abstract-model/
-
"encodieren" in "codieren"
-
Syntaktisches Codierungsschema
-
Semantisches Codierungsschema
-
"Eigenschaft-URI", "Wert-URI", "Ressource-URI"... in "URI der Eigenschaft", etc...
Änderungen, 2007-02-23 (Vorschläge von Jakob Voss)
-
Syntaktisches Codierungsschema in Syntax-Kodierungsschema
-
"Werte-URI"
-
"Werte-Zeichenkette"
-
"Mapping" in "Abbildung"
-
Jakob schlägt vor: "Wert-Zeichenkette" in "Werte-Sprachcode"
-
Tom meint aber: es ist nicht der Sprachcode für den Wert selber, sondern ein "Wert-Zeichenkette-Sprachcode"
-
"Markup" in "Auszeichnung"


