Klug, Helmut W.; helmut.klug@uni-graz.at / Zeppezauer-Wachauer, Katharina; katharina.wachauer@plus.ac.at
In einem Datenmanagementplan (DMP) werden alle relevanten Informationen zu den Daten eines Forschungsprojektes gesammelt: In der Regel umfasst das die Nennung der verantwortlichen Personen, den Projektkontext, die formale und semantische Beschreibung der Daten, die Speicherungs- und Backupstrategien, die Lösungen für die Langzeitarchivierung und eine Übersicht über rechtliche und ethische Aspekte. Prinzipiell sollte der DMP bereits während der Projektplanung begonnen werden und eine erste Skizze des Umgangs mit den Forschungsdaten enthalten. Unter Forschungsdaten versteht man im weitesten Sinn alle Daten, die im Zuge der wissenschaftlichen Arbeit anfallen und "gemanagt" werden müssen; je nach Stadium im Forschungskreislauf kann man von Rohdaten (z. B. Messwerte direkt aus einem Messgerät, unbearbeitete Bilddigitalisate), Forschungsdaten (z. B. konvertierte oder bereinigte Daten, Software, Datenmodelle) und publizierten Daten (z. B. modellierte Daten, Metadaten) sprechen. In Anlehnung an die Naturwissenschaften spricht man manchmal aber auch von Primärdaten (Daten als Grundlage für die Auseinandersetzung mit einer Forschungsfrage) und Sekundärdaten (Daten, die bei der Arbeit mit den Primärdaten entstehen). Mitunter unterteilt man auch in drei Kategorien von Daten: verwendete Daten (Texte, Bilder, Artefakte, Objekte…), im Prozess entstehende Daten sowie Daten, die das Ergebnis der Forschung abbilden. Je nach Forschungsfrage und Disziplin gibt es hier aber auch deutliche Überlappungen. (Andorfer et al. 2015, Puhl et al. 2015, Zeppezauer-Wachauer et al. 2024)
Im weiteren Verlauf eines Forschungsprojektes wird der DMP als “lebendiges Dokument” regelmäßig angepasst, damit allfällige Änderungen in Bezug auf den Umgang mit den Daten festgehalten werden; bei Änderung des DMP ist eine neue Version des Dokuments abzuspeichern.
Ein DMP spielt auch bei der Erstellung von Digitalen Editionen eine entscheidende Rolle, da diese oft eine große Menge an heterogenen, digitalen Daten generieren und verarbeiten. Digitale Editionen sind komplexe digitale Objekte, die verschiedene Komponenten umfassen, wie z. B. Texte, Bilder, Audio- und Videoaufnahmen, Datenbanken und Metadaten. Planung, Organisation und Verwaltung der Daten, die im Rahmen der Erstellung einer Digitalen Edition generiert werden, werden durch einen DMP professionalisiert.
Ein gut durchdachter und kontinuierlich angepasster DMP unterstützt dabei, Datenverluste zu vermeiden, Daten effektiv zu organisieren, zu speichern und den Austausch und die Wiederverwendung von Daten zu erleichtern. Zudem trägt ein DMP auch dazu bei, die Qualität und Nachhaltigkeit von Digitalen Editionen zu erhöhen, indem er eine klare Struktur und Leitlinien für die Datenerfassung und -verwaltung bietet. Darin wird beispielsweise festgelegt, welche Arten von Daten erfasst werden, wer für die Verwaltung der Daten verantwortlich ist, wie diese Daten auch mit Projektende angesprochen werden können, wie sie organisiert, modelliert und dokumentiert werden, wie sie gespeichert und wie sie langfristig zugänglich gemacht werden. Der DMP trägt dazu bei, die Daten eines Forschungsprojektes und den Umgang damit nachvollziehbar zu machen, indem er von Projektstart an alle relevanten Informationen zu den Daten und ihrer Verarbeitung (z. B. Standards für die Benennung und Dokumentation von Daten; Beschreibung von Workflows und Pipelines ) dokumentiert, was es anderen Forschenden letztendlich ermöglicht, die Daten zu verstehen und nachzunutzen.
Die FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) spielen in diesem Kontext eine wichtige Rolle. Dabei handelt es sich um ein Framework für die Erstellung von Daten, das mit seinem Fokus auf die Maschinenlesbarkeit der Daten darauf abzielt, ihre Wiederverwendbarkeit zu verbessern und ihre Integration in Forschungsinfrastrukturen zu erleichtern. Sie stellen eine Reihe von Leitlinien dar, um Forschungsdaten auffindbar, zugänglich, interoperabel und wiederverwendbar zu machen. Ein DMP stellt auch sicher, dass Digitale Editionen gesetzeskonform sind, indem er Urheberrechts- und Datenschutzrichtlinien und -verfahren berücksichtigt, um sicherzustellen, dass die Daten entsprechend erfasst, lizenziert (z. B. Creative Commons) und verwendet werden. Zusätzlich trägt ein DMP dazu bei, die Interoperabilität der Digitalen Editionen zu erhöhen, indem er Standardisierungsvorschriften und -praktiken enthält. Die Verwendung von Annotationsstandards, Best Practices und Normen ermöglicht es, dass Daten zwischen verschiedenen Systemen und Plattformen ausgetauscht werden können, was die Wiederverwendbarkeit (Stichwort: Re-Usability) der Daten erhöht. Durch einen DMP werden Daten zugänglicher gemacht, indem er Anforderungen an die Datenformatierung und -speicherung beschreibt, um sicherzustellen, dass die Daten von einer breiten Palette von Usern und/oder Maschinen gelesen und interpretiert werden können. Darüber hinaus benutzt man einen DMP dazu, Daten interoperabel zu machen, indem darin Standards für die Datenaustausch- und Datenintegration vorgeschlagen werden, die sicherstellen, dass die Daten zwischen verschiedenen Systemen und Plattformen ausgetauscht werden können.
Indem Anforderungen an die Datenspeicherung und -archivierung in einem DMP protokolliert werden, trägt dies auch zur langfristigen Sicherung der Daten bei.
Insgesamt spielt ein DMP bei der Erstellung von Digitalen Editionen eine wichtige Rolle, indem darin eine klare Struktur und Leitlinien für die Datenerfassung und -verwaltung bereitgestellt und sichergestellt werden, damit die Digitalen Editionen von hoher Qualität und Nachhaltigkeit sind und den wissenschaftlichen Anforderungen entsprechen.
Datenmanagementpläne können händisch erstellt werden oder mithilfe einer Reihe von Tools (vgl. Software), die unterschiedliche Vorteile wie Textbausteine, Anbindung an ein institutionelles CRIS (Current Research Information System, Forschungsinformationssystem) oder die Transformation des Textes in ein maschinenlesbares Dokument bieten. Ein DMP ist im Grunde also eine umfassende Forschungs(-daten-)dokumentation, die immer mit den Daten zusammen veröffentlicht werden sollte.
Literatur:
- Andorfer, Peter; Puhl, Johanna; Schmunk, Stefan. 2015. Forschungsdaten in Theorie und Praxis. Das DARIAH-DE Repository und die DARIAH-DE Collection-Registry.
- 2020. In: Wie fülle ich einen Datenmanagement-Plan aus? Eine Schritt-für-Schritt Anleitung für Geisteswissenschaftler*innen. Eine Veranstaltung der Reihe "Forschungsdatenmanagement in Österreich" am 9.11.2020, von 14:00 bis 15:30. Wien.
- Projekt e-Infrastructures Austria. 2015. Data Management Plan. Eine Anleitung zur Erstellung von Data Management Plänen. URL: https://fedora.phaidra.univie.ac.at/fedora/get/o:367863/bdef:Content/get.
- Puhl, Johanna; Andorfer, Peter; Höckendorff, Mareieke; Schmunk, Stefan; Stiller, Juliane; Thoden, Klaus. 2015. Diskussion und Definition eines Research Data LifeCycle für die digitalen Geisteswissenschaften . URL: https://d-nb.info/1074266595/34.
- Zeppezauer-Wachauer, Katharina; Zangerl, Lina Maria; Stigler, Johannes. 2024. Nachhaltigkeit. Schlüsselkriterium für die Akzeptanz des digitalen Weges in den Geisteswissenschaften . In: Digital Humanities in den Geschichtswissenschaften. Hrsg. von Christina Antenhofer, Chritoph Kühberger und Arno Strohmeyer. Wien.