Der Lebenszyklus von Forschungsdaten

Die Anforderungen an das Management von Forschungsdaten gehen weit √ľber die Langzeitarchivierung, einer Kernaufgabe von IANUS, hinaus. Daher soll im Folgenden kurz auf das Konzept des Datenlebenszyklus eingegangen werden.

Forschungsdaten haben im Allgemeinen eine deutlich l√§ngere Lebensdauer als die Projekte, in denen sie entstanden sind. Auch nach Ablauf von F√∂rderungsphasen kann es sein, dass Forscher weiterhin an den Daten arbeiten oder sie werden in Folgeprojekten weiter verarbeitet und erg√§nzt. Die Daten k√∂nnen auch von anderen Wissenschaftlern unter Ber√ľcksichtigung neuer Forschungsfragen wiederverwendet werden. Somit k√∂nnen aus bereits gesammelten Forschungsdaten neue Daten entstehen. Dieser Kreislauf wird mit dem sogenannten Datenlebenszyklus beschrieben.

In der gegenw√§rtigen Praxis ist der Datenlebenszyklus oft unterbrochen, da nur einige wenige Daten ihren Weg in eine Publikation finden. Die √ľbrigen Daten geraten auf den lokalen Speichermedien der Forscher in Vergessenheit oder werden komplett gel√∂scht und stehen somit einer Nachnutzung nicht mehr zur Verf√ľgung. Diese Tatsache gilt es f√ľr die Zukunft zu verbessern und im Idealfall vollst√§ndig zu vermeiden.

Datenlebenszyklus.png

Datenlebenszyklus
Datenlebenszyklus

Der hier vorgestellte Datenlebenszyklus beruht auf dem des UK Data Archive. Er beschreibt sehr vereinfacht und idealtypisch die Abfolge der einzelnen Phasen im Zyklus aus einem eher praktischen Umgang mit Forschungsdaten. Es gibt auch andere komplexere Modelle, die einen anderen Blickwinkel beschreiben, wie etwa das Curation Lifecycle Model, das verschiedene Tätigkeitsfelder bei der Erhaltung und Pflege der Daten beschreibt, und das Data Curation Continuum, das vor allem auf die technischen Bedingungen eingeht und Daten unter dem Gesichtspunkt der Nutzergruppen, von privat bis öffentlich, beschreibt.

In jeder Phase des Datenlebenszyklus gelten unterschiedliche Schwerpunkte mit ihren eigenen Implikationen, die im Folgenden umrissen werden. In dem Kapitel Projektphasen werden die wichtigsten Aspekte dann ausf√ľhrlich behandelt.

Erstellung

Vor der eigentlichen Erstellung von neuen Daten muss schon die Projektplanung erfolgt und die Fragestellung formuliert sein, die ma√ügeblich bestimmen, wie die gesammelten und erzeugten Daten letztendlich aussehen sollen. Ein Bestandteil der Planung muss auch das Datenmanagement sein, um vorab festzulegen, welche Formate und Benennungsregeln verwendet werden sollen, wie die Speicherung und Sicherung der Daten und die Vernetzung von Daten und Projektmitarbeitern untereinander aussehen soll. Bereits vorhandene relevante Daten sollten lokalisiert und ber√ľcksichtigt werden.

Schon w√§hrend der Erstellung der Forschungsdaten erfolgt idealerweise die Beschreibung der Daten, da diese besonders im Hinblick auf die sp√§tere Nachnutzung f√ľr die Verst√§ndlichkeit eine elementare Rolle spielt. Beispielsweise m√ľssen die technischen Parameter der verwendeten Aufnahmeger√§te so fr√ľh wie m√∂glich dokumentiert werden.

Verarbeitung

Sobald die Daten erhoben wurden, k√∂nnen sie verarbeitet werden. Dazu geh√∂ren verschiedene Abl√§ufe, wie etwa Digitalisierung, √úbersetzung, √úberpr√ľfung, Validierung, Bereinigung und andere Verarbeitungsformen mittels Programmen. F√ľr einige Anwendungen oder im Hinblick auf eine sp√§tere Ver√∂ffentlichung, kann eine Anonymisierung notwendig sein. Auch gilt es festzuhalten, wie Ausgangsdaten ver√§ndert und bearbeitet wurden.

Au√üerdem ist die Beschreibung von Forschungsdaten ein wichtiger Aspekt f√ľr die Archivierung, um die Verst√§ndlichkeit f√ľr die sp√§tere Nachnutzung deutlich zu erh√∂hen. W√§hrend der Verarbeitung von Forschungsdaten spielt die Verwaltung und Speicherung der Daten eine gro√üe Rolle, da gew√§hrleistet werden muss, dass mit der richtigen Version gearbeitet wird und notfalls auch Sicherheitskopien zur Verf√ľgung stehen.

Analyse

Durch die Analyse und Interpretation der Forschungsdaten werden die Forschungsergebnisse gewonnen, die dann in Publikationen veröffentlicht werden. In der Regel sind die den neuen Erkenntnissen zugrunde liegenden Daten aber nur ein kleiner Bestandteil einer solchen Publikation. Jedoch werden alle Daten benötigt, um die Analyseergebnisse vollständig nachvollziehen zu können.

Archivierung

Die Archivierung von Forschungsdaten beinhaltet die Auswahl und Umwandlung der einzelnen Dateien in geeignete Formate und deren Speicherung auf einem f√ľr die Archivierung geeigneten Medium. Die Erstellung und Speicherung von Backups geh√∂rt ebenfalls dazu.

Eine wesentliche Rolle bei der Archivierung spielt sowohl die strukturierte als auch die freie Beschreibung der Forschungsdaten, da diese Informationen dar√ľber enthalten, wie und durch wen die Daten gewonnen wurden, welche Ger√§te dabei Verwendung fanden, wie diese konfiguriert waren und was die Daten bedeuten.

Zugang

Da das Ziel einer Datenarchivierung immer die Nachnutzbarkeit von Inhalten ist, sollten archivierte Daten im Rahmen rechtlicher Rahmenbedingungen verbreitet und Dritten ein Zugriff auf diese gew√§hrt werden. Den Zugriff auf die Daten kann man mit verschiedenen Zugriffsrechten steuern, die es beispielsweise nur einer eingeschr√§nkten Gruppe von Nutzern erlauben auf die Daten zuzugreifen. Bevor die Daten zug√§nglich gemacht werden, sollte man daf√ľr sorgen, dass das Urheberrecht gekl√§rt und gekennzeichnet ist.

Durch die Zugriffsgewährung wird die Sichtbarkeit von eigenen Forschungsleistungen erhöht.

Nachnutzung

Archivierte Daten, die zug√§nglich gemacht wurden, k√∂nnen f√ľr eigene Forschungsvorhaben kostenlos wiederverwendet und neuen Analysen unterzogen werden. Durch die Nachnutzung wird die Nachpr√ľfbarkeit von Ergebnissen im Sinne der guten wissenschaftlichen Praxis erleichtert.

Autoren: 

Trognitz

Martina
DAI - IANUS

Letzte Änderung: 7. August 2017