Home | Impressum | Datenschutz | Sitemap | KIT

Forschungsdatenzyklus

Das Forschungsdatenmanagement – d.h. der Umgang mit Forschungsdaten von der Entstehung bis zur Ablage und Nachnutzung - lässt sich anschaulich als Forschungsdatenzyklus darstellen.

 

 

Allerdings laufen die einzelnen Phasen des Forschungsdatenmanagements im Allgemeinen nicht so sequentiell ab wie im obigen Forschungsdatenzyklus dargestellt. Die beispielhafte Darstellung in einem Gantt-Diagramm anhand eines Projektes zeigt die teilweise auftretende Überlappung der Phasen

 

 

Das Forschungsdatenmanagement beginnt mit der systematischen Planung, welche Daten genutzt, erhoben, verarbeitet und gespeichert werden. Auch die Projektförderung fordert im Allgemeinen ein strukturiertes Datenmanagement in der Antragsstellung. Gleichzeitig können damit auch Mittel für das Forschungsdatenmanagement beantragt werden.
Hierzu haben sich im Forschungsdatenmanagement sogenannte Datamanagementpläne (DMP) etabliert und es werden bereits Werkzeuge, z.B. RDMO oder das DMP-Tool, zur Erstellung angeboten.

   

Die Erzeugung und Erfassung der Daten, z.B. mit Sensornetzwerken oder Simulationen auf Hochleistungsrechnern, liegt im Wesentlichen in der Verantwortung der Forschenden, ebenso die Auswertung, z.B. via Algorithmen & Software. In diesem Prozess gilt es auch die notwendigen Metadaten zur Beschreibung der Forschungsdaten mitzuerfassen. Dies umfasst auch administrative und informationstechnische Metadaten. Ein Werkzeug, welches Forschende dabei unterstützt, ist z.B. ein elektronisches Laborbuch (ELN).

   

Die Speicherung der Forschungsdaten sollte in einem geeigneten Repositorium erfolgen. Hier bieten sich idealerweise Fachrepositorien aber auch allgemeine institutionelle Repositorien an. Die Forschungsdaten sollten möglichst gemeinsam mit einer guten Dokumentation abgelegt werden, um eine Nachnutzung zu ermöglichen, insbesondere auch für Dritte. Ein wichtiges Kriterium für die Speicherinfrastruktur ist die Möglichkeit der Langzeitarchivierung, z.B. via Bandspeicher.

   

Eine Grundvoraussetzung für die Nachnutzung ist der Zugang zu den Daten. Dafür müssen Zugriffs-, Nutzungsrechte etc. festgelegt sowie gegebenenfalls Patente und Lizenzen vergeben werden. Um die erzeugten Daten eindeutig zu identifizieren und zu referenzieren ist die Vergabe von Persistent Identifiers (PID) sinnvoll. Für eine möglichst breite Dissemination sollten bestehende Netzwerke und Fachcommunities über existierende und ggf. zertifizierte Infrastruktur eingebunden werden.

   

Ein gutes Forschungsdatenmanagement ermöglicht die Recherche und Nachnutzung der Ergebnisse durch andere Forschende. Diese müssen die Daten nicht erneut aufwändig erzeugen, sondern können auf den aktuellen Wissensstand aufbauen. Für die Recherche bieten sich sowohl einzelne Repositorien als auch zusammenführende Dienste wie re3data bzw. DataCite an. Auch hier gilt für Forschende die Beachtung des rechtlichen Rahmens und der guten wissenschaftlichen Praxis.