Kontrollierte Vokabulare, Thesauri und Normdaten

Damit Metadaten m├Âglichst sinnvoll genutzt und maschinell verarbeitet werden k├Ânnen, sollten neben klar definierten Metadatenschemata auch m├Âglichst einheitliche Begriffe und homogene Beschreibungen verwendet werden. Nur wenn gleiche Dinge auch mit den gleichen Begriffen benannt werden, ist es m├Âglich vollst├Ąndige und pr├Ązise Suchergebnisse zu erhalten oder vergleichbare Daten richtig miteinander zu verkn├╝pfen. Die Vorgabe und Definition von festen Begriffen und Regeln hilft zudem, Mehrdeutigkeiten und Redundanzen zu vermeiden, etwa wenn eine Zeichenkette verschiedene Bedeutungen besitzen kann (z. B. Abakus als Rechenhilfsmittel oder als architektonischer Abschluss eines Kapitells), ein identischer Sachverhalt durch unterschiedliche Worte erfasst werden kann (z. B. Survey und Oberfl├Ąchenbegehung) oder die Form der Angabe variieren kann (z. B. ein Datum in der Form 12.03.2012 oder 2012-03-12).
 
Das geeignete Mittel zur Vereinheitlichung der sprachlichen Vielfalt sind sogenannte kontrollierte oder normierte Vokabulare, die entweder einfache Wortlisten oder strukturierte Thesauri sein k├Ânnen, in denen W├Ârter zusammen mit ihrem semantischen Kontext verwaltet werden. Diese "terminologische Kontrolle" kann in unterschiedlicher Weise systematisiert und implementiert sein.

Beispielsweise k├Ânnen innerhalb eines Projektes alle zu verwendenden Begriffe unter allen Beteiligten abgestimmt, klar fachlich definiert, voneinander abgegrenzt und in strukturierter Form dokumentiert werden. Diese Absprachen k├Ânnen dann in einem zentralen Textdokument als Projektleitfaden abgelegt oder in einer Datenbank als Felder umgesetzt werden, die nur eine begrenze Auswahl von Begriffen zur Beschreibung eines spezifischen Sachverhaltes zulassen (z. B. f├╝r das Attribut Filmart nur die Werte "Diapositiv (Farbe)", "Negativfilm (Farbe)", "Negativfilm (SW)" und "Digital").

Besser eignen sich jedoch etablierte, standardisierte, globale Vokabulare, Thesauri oder Normdateien. Sie weisen oft eine thematische, fachspezifische oder institutionelle Auspr├Ągung auf und werden von ma├čgeblichen Einrichtungen kontinuierlich gepflegt. Dazu geh├Âren beispielsweise Normdateien zur Katalogisierung aus dem Bibliotheksbereich, Personennormdateien oder Thesauri zur eindeutigen Identifizierung von geografischen Orten oder Zeitbegriffen.

Diese globalen Systeme bieten nicht nur eine feste Bezeichnung und eine Definition eines Begriffes oder des diesem zugrunde liegenden Konzeptes, sondern auch alternative und gegebenenfalls mehrsprachige Benennungen und eine eindeutige Kennung zur Identifizierung des Begriffes. So kann beispielsweise der Ort "Alexandria" (361058) in Ägypten von dem Ort "Alexandria" (4744091) in den USA mittels der in den Klammern angegebenen Kennungen aus GeoNames unterschieden werden.

Bereits existierende Thesauri und Vokabulare sollten bei der Vergabe von Metadaten ber├╝cksichtigt und angewendet werden, um den sp├Ąteren elektronischen Austausch, also die Interoperabilit├Ąt, der eigenen Daten mit anderen Systemen erheblich zu vereinfachen. Wenn Ressourcen in mehreren Sprachen vorliegen und entsprechend multilingual beschrieben werden sollen, m├╝ssen die genutzten W├Ârterb├╝cher, Thesauri und Schlagwortsysteme ├Ąquivalente Begriffe in mehreren Sprachen abbilden.

F├╝r die systematische Erfassung arch├Ąologischer und allgemeiner Begriffe existieren folgende Vokabulare:

  • Art & Architecture Thesaurus (AAT) wurde Ende der 1970er von dem Getty Research Institute entwickelt, um die Katalogisierungsprozesse in Kunstbibliotheken und im Museumsbereich zu unterst├╝tzen und zu vereinheitlichen. Dieser Thesaurus wird von einer breiten Fachgemeinschaft kuratiert.
  • Heritage Data - Linked Data Vocabularies for Cultural Heritage f├╝hrt die in England genutzten Vokabulare im Bereich kulturelles Erbe zusammen.
  • Wortnetz Kultur (WNK) wurde vom Landschaftsverband Rheinland ins Leben gerufen, um die Inhalte in deren verschiedenen Informationssystemen zu vereinheitlichen. Mittlerweile sind die Themen Kulturlandschaft, Arch├Ąologie, Kulturanthropologie, Denkmalpflege sowie Kunstgeschichte mit rund 15.000 Begriffen vertreten.
  • Das DAI bietet mit iDAI.vocab (auch archwort) ein flaches multilinguales Vokabular mit Links auf den AAT. Au├čerdem gibt es mit dem iDAI.thesaurus ein System, das die Schlagworte aus den unterschiedlichen Thesauri der Bibliotheken zusammenf├╝hrt und strukturiert.
  • Die Encyclopedia of Life stellt eine weltweite Datenbank f├╝r Pflanzen und Lebewesen dar, die zus├Ątzlich Fotos, Verbreitungskarten und Literaturhinweise enth├Ąlt.
  • In Wikidata werden alle strukturierten Daten aus den Systemen von WikiMedia erfasst und mit eindeutigen Identifikatoren zur Verf├╝gung gestellt.

F├╝r die eindeutige Identifizierung von geografischen Orten eignen sich, neben den amtlichen Gemeindekennzahlen und dem geod├Ątischen Parameterdatensatz EPSG, folgende Ortshesauri, sogenannte Gazetteers:

  • GeoNames ist ein Gazetteer, in dem vor allem moderne Orte, deren alternative Bezeichnungen und geografischen Koordinaten systematisch erfasst werden. Die Inhalte stammen von engagierten Nutzern weltweit.
  • Getty Thesaurus of Geographic Names (TGN) wurde 1987 von dem Getty Research Institute ins Leben gerufen, um ebenfalls deren Katalogisierungsprozesse in Kunstbibliotheken und im Museumsbereich zu unterst├╝tzen und zu vereinheitlichen.
  • Das DAI betreibt mit dem iDAI.gazetteer einen Gazetteer f├╝r die eindeutige Adressierung von antiken Orten, in dem au├čerdem auch die Eintragungen in GeoNames ber├╝cksichtigt werden.
  • Pleiades ist ebenfalls ein Gazetteer f├╝r antike Orte mit einem Schwerpunkt auf der griechischen und r├Âmischen Antike, dessen Inhalt durch jeden Nutzer erweitert oder korrigiert werden kann.

Auch f├╝r Zeitbegriffe gibt es kontrollierte Vokabulare:

  • PeriodO ist ein Gazetteer f├╝r Zeitepochen. Neben der zeitlichen Information wird auch die geografische Verbreitung der jeweiligen Epoche erfasst.
  • iDAI.chronontology ist ein vom DAI durchgef├╝hrtes Projekt, das wie PeriodO zeitliche und geografische Informationen miteinander in Beziehung setzt.

Zur Erfassung von Informationen zu Personen oder Institutionen sollten Normdateien verwendet werden, wie beispielsweise:

  • Das Virtual International Authority File (VIAF) kombiniert Normdateien mehrerer Nationalbibliotheken und speichert Informationen zu Personen und Institutionen, sowie deren Publikationen.
  • Die Open Researcher and Contributor ID (ORCID) ist eine alphanumerische Zeichenkette, die der eindeutigen Identifizierung wissenschaftlicher Autoren dient. ORCID wird von einem gemeinn├╝tzigen Gremium betrieben und Autoren m├╝ssen sich selbst registrieren, um eine ID zu bekommen.
  • Die Gemeinsame Normdatei (GND) der Deutschen Nationalbibliothek dient prim├Ąr der Katalogisierung in Bibliotheken. Neben Informationen zu Personen und K├Ârperschaften werden auch weitere Informationen zu Konferenzen, Geografika, Sachschlagw├Ârtern und Werktiteln verwaltet.

Wenn in Metadaten auf Publikationen verwiesen werden soll, eignen sich folgende Systeme:

  • Die Internationale Standardbuchnummer (engl. International Standard Book Number, ISBN) wird zur eindeutigen Identifizierung von Publikationen verwendet. Sie ist vor allem im Buchhandel verbreitet. F├╝r Reihen und Zeitschriften wird eine ├Ąhnliche Nummer, die ISSN (Internationale Standardnummer f├╝r fortlaufende Sammelwerke, engl. International Standard Serial Number) verwendet.
  • F├╝r in Deutschland ver├Âffentlichte Medienwerke gibt es eine Ablieferungspflicht bei der Deutschen Nationalbibliothek, weshalb die dort vergebenen┬á eindeutigen Kennungen ebenfalls zur Identifizierung verwendet werden k├Ânnen.
  • F├╝r arch├Ąologische und altertumswissenschaftliche Publikationen eignen sich auch die Identifikatoren aus iDAI.bibliography (Zenon), in dem die umfangreichen Best├Ąnde aller DAI Bibliotheken nachgewiesen werden.
Autoren: 

Bibby

David
Landesamt f├╝r Denkmalpflege Baden-W├╝rttemberg

Gerth

Philipp
DAI

Heinrich

Maurice
DAI - IANUS

Jahn

Sabine
ehemals DAI - IANUS

Ludwig

Bernhard
DAI Istanbul

Posluschny

Axel
Keltenwelt am Glauberg

Siegloff

Eicke
Arch├Ąologisches Landesamt Schleswig-Holstein

Sieverling

Anne
DAI - IANUS

Trognitz

Martina
DAI - IANUS

Letzte Änderung: 18. November 2017