Research Data Management (RDM)

Handling data is essential for the scientific research process. Data is generated, processed, and utilized in various forms in research. With the increasing volume of data and the opportunities for reuse brought about by digitalization, the importance of managing research data is also growing.

What are research data?

Research data can be defined as any data generated in the context of scientific research activities. Due to the diverse range of scientific methods, disciplines, and research interests, there exists a wide variety of different types of research data, most of which are now digital. In research, data are created, processed, and utilized in forms such as measurement data, laboratory values, survey data, interviews, texts, or audiovisual documents. Even testing procedures, such as simulations or questionnaires, can be included in this category.

Publish your research data!

HAW Hamburg has established REPOSIT (https://reposit.haw-hamburg.de/), an institutional repository for the publication and long-term storage of research data. All datasets in REPOSIT are assigned persistent identifiers (DOI, Handle) and enriched with metadata. When publishing your data, you should regulate its reuse by assigning a license. In REPOSIT, you can choose between various licenses such as Creative Commons or the GNU General Public License. Since data publication is currently in beta mode, individual activation is required. Please feel free to contact us at hibs.oa (at) haw-hamburg (dot) de for this purpose. The maximum upload size is generally 512 MB per file, but larger files can be accommodated upon request.

For the direct exchange of data within scientific communities, discipline-specific repositories are also suitable for data publication. A comprehensive selection of recognized repositories, such as Pangaea for Earth & Environmental Science, is available in the Registry of Research Data Repositories (re3data.org), categorized by discipline, licenses, access policies, and many other criteria.

Additionally, several large generic repositories have been established worldwide, open to researchers from all disciplines. The most well-known include Harvard Dataverse, Zenodo (operated by CERN), the European platform B2Share (founded as part of an EU Horizon 2020 project), OSF Home as part of the comprehensive Open Science Framework, and Dryad. These repositories offer free licenses, persistent identifiers like DOI for published data, metadata descriptions, data versioning, storage capacities exceeding 50 GB in some cases, and many other features free of charge.

Wozu Forschungsdatenmanagement?

Ziel des Forschungsdatenmanagements ist es, Methoden, Verfahren und Strategien zu entwickeln, die einen systematischen Umgang mit Forschungsdaten gewährleisten und ihre nachhaltige Nutzbarkeit sicherstellen. Von der Datenerstellung bis zur Datennachnutzung unterstützt das Forschungsdatenmanagement Ihre wissenschaftliche Forschung entlang des Datenlebenszyklus – sowohl bei der Planung, Erstellung und Aufbereitung von Daten sowie der Datenanalyse als auch hinsichtlich Fragen der Archivierung, Sicherung, Publikation, des Teilens und der Nachnutzung von Daten.

Das Forschungsdatenmanagement unterstützt bei:

  • der prinzipiellen Organisation des Forschungsprozesses – eine vorausschauende Planung des Umgangs mit Daten in Forschungsprojekten ist essentieller Bestandteil der wissenschaftlichen Praxis
  • der Erfüllung von Vorgaben von Forschungsförderern – für zahlreiche Förderer ist ein belastbares Forschungsdatenmanagement Voraussetzung für eine Förderung
  • der Nachnutzbarkeit von Daten – mit Hilfe von Metadaten und Lizenzen wird die Nachnutzung von Daten durch anderen Forschende ermöglicht
  • der Transparenz und Nachvollziehbarkeit von Forschungsprozessen – die Dokumentation von Daten und Analyseschritten macht Forschung nachvollziehbar und stellt die Grundlage für die Reproduzierbarkeit von Ergebnissen dar
  • der Sichtbarmachung von Forschung und neuen Kooperationsmöglichkeiten – insbesondere veröffentlichte Daten können ihren Forschungsprojekten zusätzliche Sichtbarkeit verschaffen und Kooperationen initiieren
  • Zitierbarkeit von Daten – über die Veröffentlichung Ihrer Daten als eigenständige Publikation oder Supplement und die Vergabe von persistenten Identifikatoren wie DOI sind Ihre Forschungsdaten zitierfähig und dauerhaft referenzierbar.

FAIR – Forschung nachhaltig gestalten!

Mit den vier grundsätzlichen FAIR Data Principles hat FORCE11, ein internationaler Zusammenschluss von Personen aus der wissenschaftlichen Forschung, aus Bibliotheken, Archiven, Verlagen und der Forschungsförderung, wesentliche Anforderungen an Forschungsdaten formuliert, die eine nachhaltige Verwendung ermöglichen. Auch die DFG weist in ihren „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ explizit darauf hin, dass der Zugang zu Forschungsdaten gemäß der FAIR-Prinzipien erfolgen sollte. Diese vier Anforderungen an Forschungsdaten sind:

  • Findable: Persistente und global eindeutige Identifikatoren (wie z. B. DOI) sowie umfangreiche Metadaten sorgen für optimale Auffindbarkeit und Zitierfähigkeit von Forschungsdaten.
  • Accessible: Der Zugang zu Forschungsdaten und Metadaten sollte einfach und unter Verwendung eines offenen, freien sowie maschinenlesbaren Protokolls möglich sein.
  • Interoperable: Um Forschungsdaten langfristig maschinell lesbar verknüpfen zu können, müssen Daten vergleichbar sein und Metadaten auf kontrollierten Vokabularen, Klassifikationen etc. basieren.
  • Reusable: Forschungsdaten und Metadaten sollten optimal beschrieben, dokumentiert und rechtlich sicher lizenziert sein, um die Nachnutzung zu gewährleisten.

Die vollständigen FAIR-Prinzipien wurden 2016 in Scientific Data veröffentlicht.

Datenmanagementpläne

Datenmanagementpläne (DMP) sind ein wichtiges Hilfsmittel im Rahmen des Forschungsdatenmanagements. Sie dokumentieren den Umgang mit Forschungsdaten im Rahmen von Forschungsprojekten und sollten idealerweise vor Beginn des eigentlichen Forschungsprozesses erstellt werden. Nicht zuletzt durch die verpflichtenden Angaben zum Umgang mit Forschungsdaten bei Forschungsförderern wie der DFG oder der EU finden DMP zunehmend Verbreitung.

Für DMP gibt es zahlreiche Vorlagen und Fragenkataloge zur Erstellung, die Wissenschaftler*innen strukturiert durch die relevanten Themen des Datenmanagements leiten. Typische Fragen sind:

  • Welche Daten werden erhoben und verwendet?
  • Welche Software wird zur Datensammlung bzw. -generierung eingesetzt?
  • Wo werden die Daten während des Forschungsprozess gespeichert?
  • Wie werden die Daten geschützt?
  • In welchen Formaten (z. B. CSV, PDF etc.) werden die Daten archiviert?
  • Welche Metadaten werden vergeben, damit Ihre Daten identifizierbar sind?
  • Wie werden die rechtlichen Anforderungen an den Schutz personenbezogener Daten realisiert?
  • Wo und für welchen Zeitraum werden die Daten archiviert?
  • Wie soll die Nachnutzung geregelt, welche Lizenzen sind geplant?

Hilfestellungen und Muster für Datenmanagementpläne