Research Data Management (RDM)
Handling data is essential for the scientific research process. Data is generated, processed, and utilized in various forms in research. With the increasing volume of data and the opportunities for reuse brought about by digitalization, the importance of managing research data is also growing.
What are research data?
Research data can be defined as any data generated in the context of scientific research activities. Due to the diverse range of scientific methods, disciplines, and research interests, there exists a wide variety of different types of research data, most of which are now digital. In research, data are created, processed, and utilized in forms such as measurement data, laboratory values, survey data, interviews, texts, or audiovisual documents. Even testing procedures, such as simulations or questionnaires, can be included in this category.
Publish your research data!
Wozu Forschungsdatenmanagement?
Ziel des Forschungsdatenmanagements ist es, Methoden, Verfahren und Strategien zu entwickeln, die einen systematischen Umgang mit Forschungsdaten gewährleisten und ihre nachhaltige Nutzbarkeit sicherstellen. Von der Datenerstellung bis zur Datennachnutzung unterstützt das Forschungsdatenmanagement Ihre wissenschaftliche Forschung entlang des Datenlebenszyklus – sowohl bei der Planung, Erstellung und Aufbereitung von Daten sowie der Datenanalyse als auch hinsichtlich Fragen der Archivierung, Sicherung, Publikation, des Teilens und der Nachnutzung von Daten.
Das Forschungsdatenmanagement unterstützt bei:
- der prinzipiellen Organisation des Forschungsprozesses – eine vorausschauende Planung des Umgangs mit Daten in Forschungsprojekten ist essentieller Bestandteil der wissenschaftlichen Praxis
- der Erfüllung von Vorgaben von Forschungsförderern – für zahlreiche Förderer ist ein belastbares Forschungsdatenmanagement Voraussetzung für eine Förderung
- der Nachnutzbarkeit von Daten – mit Hilfe von Metadaten und Lizenzen wird die Nachnutzung von Daten durch anderen Forschende ermöglicht
- der Transparenz und Nachvollziehbarkeit von Forschungsprozessen – die Dokumentation von Daten und Analyseschritten macht Forschung nachvollziehbar und stellt die Grundlage für die Reproduzierbarkeit von Ergebnissen dar
- der Sichtbarmachung von Forschung und neuen Kooperationsmöglichkeiten – insbesondere veröffentlichte Daten können ihren Forschungsprojekten zusätzliche Sichtbarkeit verschaffen und Kooperationen initiieren
- Zitierbarkeit von Daten – über die Veröffentlichung Ihrer Daten als eigenständige Publikation oder Supplement und die Vergabe von persistenten Identifikatoren wie DOI sind Ihre Forschungsdaten zitierfähig und dauerhaft referenzierbar.
FAIR – Forschung nachhaltig gestalten!
Mit den vier grundsätzlichen FAIR Data Principles hat FORCE11, ein internationaler Zusammenschluss von Personen aus der wissenschaftlichen Forschung, aus Bibliotheken, Archiven, Verlagen und der Forschungsförderung, wesentliche Anforderungen an Forschungsdaten formuliert, die eine nachhaltige Verwendung ermöglichen. Auch die DFG weist in ihren „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ explizit darauf hin, dass der Zugang zu Forschungsdaten gemäß der FAIR-Prinzipien erfolgen sollte. Diese vier Anforderungen an Forschungsdaten sind:
- Findable: Persistente und global eindeutige Identifikatoren (wie z. B. DOI) sowie umfangreiche Metadaten sorgen für optimale Auffindbarkeit und Zitierfähigkeit von Forschungsdaten.
- Accessible: Der Zugang zu Forschungsdaten und Metadaten sollte einfach und unter Verwendung eines offenen, freien sowie maschinenlesbaren Protokolls möglich sein.
- Interoperable: Um Forschungsdaten langfristig maschinell lesbar verknüpfen zu können, müssen Daten vergleichbar sein und Metadaten auf kontrollierten Vokabularen, Klassifikationen etc. basieren.
- Reusable: Forschungsdaten und Metadaten sollten optimal beschrieben, dokumentiert und rechtlich sicher lizenziert sein, um die Nachnutzung zu gewährleisten.
Die vollständigen FAIR-Prinzipien wurden 2016 in Scientific Data veröffentlicht.
Datenmanagementpläne
Datenmanagementpläne (DMP) sind ein wichtiges Hilfsmittel im Rahmen des Forschungsdatenmanagements. Sie dokumentieren den Umgang mit Forschungsdaten im Rahmen von Forschungsprojekten und sollten idealerweise vor Beginn des eigentlichen Forschungsprozesses erstellt werden. Nicht zuletzt durch die verpflichtenden Angaben zum Umgang mit Forschungsdaten bei Forschungsförderern wie der DFG oder der EU finden DMP zunehmend Verbreitung.
Für DMP gibt es zahlreiche Vorlagen und Fragenkataloge zur Erstellung, die Wissenschaftler*innen strukturiert durch die relevanten Themen des Datenmanagements leiten. Typische Fragen sind:
- Welche Daten werden erhoben und verwendet?
- Welche Software wird zur Datensammlung bzw. -generierung eingesetzt?
- Wo werden die Daten während des Forschungsprozess gespeichert?
- Wie werden die Daten geschützt?
- In welchen Formaten (z. B. CSV, PDF etc.) werden die Daten archiviert?
- Welche Metadaten werden vergeben, damit Ihre Daten identifizierbar sind?
- Wie werden die rechtlichen Anforderungen an den Schutz personenbezogener Daten realisiert?
- Wo und für welchen Zeitraum werden die Daten archiviert?
- Wie soll die Nachnutzung geregelt, welche Lizenzen sind geplant?
Hilfestellungen und Muster für Datenmanagementpläne
- Checkliste (PDF) der DFG zum Umgang mit Forschungsdaten
- Checkliste (PDF) für einen Data Management Plan des Digital Curation Center
- Offizielles DMP-Template für EU Horizon Europe (Version 1.0, Stand 5. Mai 2021)
- Muster-DMP (PDF) der HU Berlin für DFG-Anträge
- Muster-DMP (PDF) der HU Berlin für BMBF-Anträge
- Beispiele für DMP aus dem Data Management Planning Tool der University of CaliforniaBeispielhafte DMP aus verschiedenen Disziplinen von der LIBER Research Data Management Working Group auf zenodo.org