Home | Impressum | Sitemap | KIT

Forschungsdaten

Definition

Eine genaue Definition von Forschungsdaten und deren Abgrenzung von anderen Daten ist anspruchsvoll.

  • DFG:
    Unter Forschungsdaten sind […] digitale und elektronisch speicherbare Daten zu verstehen, die im Zuge eines wissenschaftlichen Vorhabens z.B. durch Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen. (DFG, 2010)
     
  • Report of the European Commission Public Consultation on Open Research Data:
    [...] defining research data as potentially all data, and others limiting it to data that is the product of research and/or data that is used for research. (EU, 2013)
     
  • im Projekt re3data:
    Unter Forschungsdaten werden digital vorliegende Daten verstanden, die im Rahmen von Forschungsprojekten (im weitesten Sinne) erhoben oder erzeugt werden und die Grundlage von Forschungsergebnissen, Publikationen etc. bilden.

     

  Die Spannweite von Forschungsdaten lässt sich anschaulich in einem ternären System (Dreieck) darstellen. Exemplarisch sind einige typische Felder von Forschungsdaten eingezeichnet.

 

Metadaten

 

Wissenschaftliche und informationstechnische Metadaten

Forschungsdaten durchlaufen vom Moment ihrer Entstehung bis zur (bedingten) Veröffentlichung einen Prozess, der drei grundlegenden Anforderungen Rechnung tragen muss:

  • Authentizität (Sind die Daten das, was sie zu sein vorgeben?)
  • Integrität (Sind die Daten seit ihrer Entstehung inhaltlich unverändert?)
  • Verständlichkeit (Können auch außerhalb des Ursprungsprojekts die Daten sicher gedeutet werden?)

Während dieses Reifeprozesses werden die Forschungsdaten aggregiert, reduziert und konvertiert. Zugleich werden sie schrittweise mit Metadaten angereichert:

  1. mit wissenschaftlich/technischen Beiwerten ("Umgebungsparametern")
  2. mit informationstechnischen Metadaten

Reifestadien von Forschungsdaten

Die drei Pflichten der Authentizität, Integrität und Verständlichkeit sind "Dauerläufer", die nicht nur in einer grundlegenden Leistung zu erbringen sind, sondern auch für die laufenden Erhaltungsarbeiten gelten. Eine entsprechende Anpassung der Metadaten geschieht in aller Regel nicht in einem Kontinuum, sondern von Zeit zu Zeit, etwa bei Formatwechseln oder mit der Zeit vielleicht bei nötigen Ergänzungen von Angaben zur Verständlichkeit. 

 

Administrative Metadaten

Im Laufe des Forschungsdatenmanagements rücken in einem dritten Schritt weitere kontextuelle Metadaten ins Blickfeld: Die zu den eigentlichen Forschungsdaten gehörigen administrativen Daten. Insbesondere im Rahmen rechtlicher Aspekte (Urheberrechte, Nutzungsrechte etc.) erweisen sich diese Daten als notwendig. Die  Nachnutzbarkeit von Forschungsdaten kann von der Verfügbarkeit administrativer Daten abhängen, etwa wenn für einen Drittmittelantrag der Nachweis der freien Verfügbarkeit der nachzunutzenden Daten erforderlich ist.

 

 

Lebenszyklus von Forschungsdaten

Es gibt eine Vielzahl von Lebenszyklus-Modellen für digitale Informationen, darunter Forschungsdaten. Folgendes Modell wurde im Rahmen des WissGrid-Projekts beschrieben und basiert auf dem Curation Lifecycle Model.

Neben den lebenszyklusabhängigen Aspekten gibt es für das Management von Forschungsdaten übergreifende Aspekte und Querschnittsaufgaben:

  • Institutionelle Rahmenbedingungen und Policies
  • Finanzierung und Förderung
  • Rechtliche und ethische Aspekte