Projektübersicht

Analyse altertumswissenschafticher Forschungsdaten

Um die Testbeds in den verschiedenen Arbeitspaketen mit realistischen Daten durchführen zu können, wurden von verschiedenen Akteuren inidviduelle Forschungsdaten zur Verfügung gestellt. Diese bestehen in der Regel aus Teilbestände von laufenden Projekten und stammen von unterschiedlichen Datengebern. Sie wurden in Universitäten, Hochschulen, Museen, dem DAI, Akademien und Bodendenkmalämtern erzeugt und IANUS zur internen Nutzung und Analyse anvertraut. Dabei wurde ein großer Teil der in Zukunft zu betreuenden Fachbereiche abgedeckt, wie die klassische, prähistorische und mittelalterliche Archäologie, Paläontologie, Philologie, Anthropologie, Archäozoologie und Orientalistik. Auf diese Weise können die unterschiedlichen angewandten Untersuchungsmethoden und erzeugten Dateiformate aus Feldforschungsprojekten und philologischen Untersuchungen getestet, passende Archivierungsstrategien erstellt, Arbeitsabläufe optimiert und Probleme mit bestimmten Systemen oder Formaten behoben werden.

Datengeber

Die Testforschungsdaten stammen im Einzelnen von
  • Universität Tübingen: Troja
  • HTW Berlin: Virtual Archaeology in Aleppo
  • TOPOI: A I 1 Kasachstan, C III Bronze Age Deposits
  • SPP 1171: Fürstensitze und Umland
  • BBAW Berlin: Altägyptisches Wörterbuch
  • Neanderthal-Museum: Wendel und Schädel aus Salzgitter
  • Prähistorische Sammlung München: Archäometriedatenbank München
  • Römisch-Germanisches Museum, Archäologische Denkmalpflege: Ausgrabungen am Kurt-Hackenberg-Platz in Köln
  • Generaldirektion Kulturelles Erbe Rheinland-Pfalz, Außenstelle Trier im Rheinischen Landesmuseum Trier: Ausgrabungen an der Moselschleuse in Trier
  • LVR-Amt für Bodendenkmalpflege im Rheinland: Burgen im Rheinland
  • DAI: Taganrog, Faustina-Thermen in Milet, Pergamon, Tell Zira'a, Holozäne Wirbeltierfauna Europas

Allen Datengebern sei ganz herzlich für die Unterstützung und Mithilfe gedankt, die dazu beitragen, die Anforderungen und Lösungen von IANUS anhand aktueller Bedürfnisse in den Altertumswissenschaften zu formulieren.

Merkmale der Daten

Alle Testdaten wurden nicht explizit für die Archivierung vorbereitet und entsprechen somit wohl dem Zustand der zukünftig bei IANUS zu kuratierenden Dateien. Es wurde bei den Datensammlungen auch keine systematische Datenauswahl, Formatüberprüfung oder Ordnerbenennung vorgenommen und der Grad der strukturierten Ablage ist sehr unterschiedlich.
Die Summe der bereits vorhandenen 17 Testdatensammlungen beläuft sich zur Zeit auf über 240.000 Dateien mit über 700.000 MB (Stand 12.2013). Die bisher ca. 450 verschiedenen Dateitypen, von denen nur ein kleiner Teil archivfähig ist, bestehen großteils aus Bilddateien. Viele davon sind im für die Langzeitarchivierung ungünstigen jpg-Format erzeugt, aber es wurden auch Forschungstestdaten in tif-, dng-, txt-Format, uvm. zur Verfügung gestellt. Im Vergleich des Speicherplatzes der Dateitypen nehmen die jpg-Dateien proportional ab und die für die Langzeitarchivierung empfohlenen tif-Dateien zu, gefolgt von den wd- und dng-Formaten.

Vorläufiges Fazit

Allein durch diese ersten Statistiken wird klar, wie dringend IT-Empfehlungen für einen nachhaltigen Umgang mit digitalen Daten formuliert und schon vor Beginn von Forschungsprojekten angewendet werden müssen, um diese ungünstigen Dateiformate erst gar nicht bei der Dokumentation zu verwenden. Auch wenn es sich z.B. bei jpg um ein im Alltag bequemes Format handelt, drohen die Bildinformationen bei einer Archivierung der meist unwiederbringlichen Forschungsdaten verloren zu gehen oder müssen zeit- und kostenaufwendig umgewandelt werden, weshalb sie unbedingt vermieden werden sollten.

 
Datenschutz