Forschungsdaten / Open Data

Wo geforscht wird, entstehen Forschungsdaten. Unter Forschungsdaten werden alle digital vorliegenden Daten verstanden, die während des Forschungsprozesses entstehen oder seine Ergebnisse sind.

FreiDok plus
Nützliche Tools (Navigation)
Was sind Forschungsdaten / Open Data?

"Forschungsdaten sind eine wesentliche Grundlage für das wissenschaftliche Arbeiten. Die Vielfalt solcher Daten entspricht der Vielfalt unterschiedlicher wissenschaftlicher Disziplinen, Erkenntnisinteressen und Forschungsverfahren. Zu Forschungsdaten zählen u.a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten, Objekte aus Sammlungen oder Proben, die in der wissenschaftlichen Arbeit entstehen, entwickelt oder ausgewertet werden." (Leitlinien der Deutschen Forschungsgemeinschaft zum Umgang mit Forschungsdaten)

Der verantwortliche Umgang mit solchen als Vorbedingung, Produkt oder Ergebnis des Forschungsprozesses entstandenen (digitalen) Daten ist wesentlicher Bestandteil der guten wissenschaftlichen Praxis. Ihre langfristige Sicherung und Bereitstellung gewährleistet die Nachvollziehbarkeit wissenschaftlicher Arbeit. Von Open Data im Sinne der Open Definition spricht man, wenn (Forschungs-)Daten – gegebenenfalls unter den Bedingungen einer freien Lizenz – von jedermann frei benutzt, weiterverwendet und geteilt werden können.

Prinzipien zum Umgang mit Forschungsdaten

FAIR (Findable, Accessible, Interoperable, Reusable)

Die FAIR-Prinzipien umfassen Standards bei der Beschreibung, Speicherung und Veröffentlichung wissenschaftlicher Daten. Sie sollen sicherstellen, dass Forschungsdaten sowohl von Menschen als auch von Maschinen zuverlässig nachgenutzt werden können. Das Akronym FAIR steht für

  • Findable (auffindbar): Die Daten sind mit einem persistenten Identifikator sowie mit menschen- und maschinenlesbaren Metadaten versehen und sind in einer durchsuchbaren Ressource registriert oder indiziert.
  • Accessible (zugänglich): Die Daten können über ein standardisiertes Kommunikationsprotokoll abgerufen und heruntergeladen werden. Auch für nicht unmittelbar verfügbare Daten sind beschreibende Metadaten hinterlegt.
  • Interoperable (interoperabel): Die Daten liegen in einer Form vor, die es erlaubt, dass sie (semi)automatisch ausgetauscht, interpretiert und mit anderen Datensätzen verknüpft werden können. Dies wird beispielsweise durch die Verwendung standardisierter Formate, Ontologien oder Vokabulare erreicht.
  • Reusable (wiederverwendbar): Die Daten sind hinsichtlich ihrer Provenienz beschrieben. Durch die Nutzung persistenter Identifikatoren und die Vergabe standardisierter Lizenzen können sie zuverlässig und rechtssicher zitiert und nachgenutzt werden.

CARE (Collective Benefit, Authority to Control, Responsibility, Ethics)

Die CARE-Prinzipien gehen aus der Beschäftigung mit Daten hervor, die indigene Gemeinschaften betreffen, und verstehen sich komplementär zu den FAIR-Prinzipien. Allgemeiner gesprochen formulieren die CARE-Prinzipien Grundsätze der Forschungs- und Datenethik.

Infrastrukturen für Forschungsdaten

Wissenschaftler*innen sind frei in der Auswahl geeigneter Repositorien für ihre Forschungsdaten. Meist sind für die Speicherung, Veröffentlichung und Archivierung der Daten überregionale, für die jeweilige wissenschaftliche Disziplin oder Community spezifische Forschungsdatenrepositorien zu empfehlen. Einen Überblick über Repositorien weltweit gibt die Registry of Research Data Repositories (re3data).

Nationale Forschungsdateninfrastruktur (NFDI)

Die Nationale Forschungsdateninfrastruktur (NFDI) soll Datenbestände von und für Wissenschaft und Forschung systematisch erschließen, nachhaltig zugänglich machen und nationale und internationale Kooperationen anstoßen. Sie wird als vernetzte Struktur von 26 fachlich organisierten Konsortien aufgebaut. In den NFDI-Konsortien arbeiten Wissenschaftler*innen, Fachgesellschaften und -communities sowie Infrastruktureinrichtungen und -projekte zusammen, um disziplinspezifische Services, Trainingsangebote und Standards für den Umgang mit Daten zu entwickeln.

European Open Science Cloud (EOSC)

Die European Open Science Cloud (EOSC) ist das wichtigste Infrastrukturprojekt der Europäischen Komission für ein europaweit vernetztes Forschungsdatenmanagement. Ziel ist es, Forschenden, Entwickler*innen, Unternehmen und Bürger*innen ein gemeinsames, offenes und multidisziplinäres Umfeld zu bieten, in dem sie Daten, Werkzeuge und Dienste für Forschungs-, Innovations- und Bildungszwecke publizieren, finden und nachnutzen können.

Was bedeutet Forschungsdatenmanagement?

Forschungsdatenlebenszyklus

Forschungsdatenmanagement ist ein zentraler Bestandteil der guten wissenschaftlichen Praxis. Es vereint methodische, konzeptionelle, technische und organisatorische Entscheidungen und Maßnahmen, um Forschungsdaten innerhalb ihres digitalen Lebenszyklus und darüber hinaus zu handhaben. Die folgende Grafik veranschaulicht die Phasen des Forschungsdatenlebenszyklus, der mit der Projektplanung beginnt und den Forschungsprozess bis zu einer möglichen Nachnutzung der entstandenen Daten begleitet:

Abbildung: Nicolaas Bongaerts/Stefano Della Chiesa, Research Data Management Lifecycle, 25.04.2022, DOI 10.5281/zenodo.6602006, CC BY 4.0 International

Datenmanagementplan

Ein Datenmanagementplan (DMP) beschreibt und operationalisiert die Phasen des Forschungsdatenlebenszyklus mit Blick auf ein konkretes Forschungsvorhaben. Zahlreiche Forschungsförderer erwarten bei der Stellung eines Förderantrags die Einreichung eines Datenmanagementplans mit verbindlichen Aussagen zu anfallenden Daten, deren Organisation und Qualität sowie zur Speicherung und Zugänglichmachung während des Projekts und nach Projektende.

Forschungsdatenmanagement an der Universität Freiburg

Die Universität Freiburg hat sich im Jahr 2022 eine "Policy zum Umgang mit Forschungsdaten" gegeben. Diese umfasst ein Bekenntnis zu den Prinzipien von 'Open Science' und 'Open Data' und definiert die Verantwortlichkeiten von Forschenden ebenso wie der Universität über den ganzen Datenlebenszyklus hinweg.

In Anlehnung an das Referenzmodell für Strategieprozesse im institutionellen Forschungsdatenmanagement (RISE-DE) entwickelt die Universität das Angebot für Forschende zum Thema Forschungsdatenmanagement kontinuierlich weiter. Initiativen zum Forschungsdatenmanagement werden derzeit innerhalb der Universität in der Research Data Management Group (RDMG) gebündelt.

Nachweise für Forschungsdatensets, die beispielsweise auf einem fachlichen Repositorium veröffentlicht wurden, können bereits jetzt auf der Publikationsplattform FreiDok plus verankert werden. Das Forschungsdatenrepositorium FreiData, mit dem Angehörigen der Universität eine institutionelle Plattform zur Verfügung stehen soll, um Daten und Forschungsergebnisse zu veröffentlichen und damit den Forschungsprozess im Sinne von Open Science zu öffnen, befindet sich derzeit im Aufbau. Es ist komplementär zu diszipinspezifischen Repositorien und übergreifenden Infrastrukturprojekten wie der Nationalen Forschungsdateninfrastruktur (NFDI) zu verstehen.

Weiterführende Informationen
Universität Freiburg

Chat

Insta