Forschungsdatenmanagement

Forschungsdatenmanagement
© Colourbox.de

Die FDM-Beratungsstelle ist eine Zusammenarbeit der Universitätsbibliothek, des Zentrums für Forschungsförderung, des Universitätsrechenzentrums, der Servicestelle Methoden und der Rechtsabteilung der KU.

Wir unterstützen Forscher/-innen und Studierende der KU rund um das Thema Forschungsdatenmanagement

  • bei der Planung des Umgangs mit Forschungsdaten und Gestaltung eines spezifischen Forschungsdatenmanagementplanes für Förderanträge (die in der Regel die Erstellung eines Datenmanagementplans erforderlich machen)
  • bei Fragen zur Speicherung und Dokumentation von Forschungsdaten im Verlauf eines Forschungsvorhabens sowie
  • bei der Suche nach passenden Lösungen zur Veröffentlichung und Archivierung der Forschungsdaten nach Abschluss eines Projekts


Bei Fragen zum FDM wenden Sie sich an fdm(at)ku.de.

Allgemeine Informationen

Forschungsdaten und Forschungsdatenmanagement: Worum geht es?

Definition Forschungsdaten

Forschungsdaten sind Daten, die während eines wissenschaftlichen Vorhabens generiert und analysiert werden, um zu wissenschaftlichen Erkenntnissen zu gelangen und diese zu begründen.

Forschungsdaten können beispielsweise sein:

  • Mess-, Beobachtungsdaten: Ergebnisse von Laborexperimenten, Feldstudien oder klinischen Tests

  • Befragungsdaten: Antworten auf Fragebögen oder Interviews

  • Methodische Testverfahren: Fragebögen, Software und Simulationen
  • Bild-, Audio- und Videomaterial: Fotografien, Mikroskopiebilder, Röntgenaufnahmen, Audiodateien, Videos oder andere visuelle Aufzeichnungen

  • Textdaten: Dokumente, Textkorpora, Berichte, Artikel, Manuskripte und andere schriftliche Informationen

  • Digitale Repräsentationen von analogen Daten: Endprodukt der Digitalisierung von Texten, Bildern und/oder Artefakten
  • Finanz- und Wirtschaftsdaten: Statistiken, Finanzberichte, Handelsdaten und andere wirtschaftliche Informationen


Definition Forschungsdatenmanagement (FDM)

Ziel guter wissenschaftlicher Praxis ist es, die langfristige Integrität, Qualität und Zugänglichkeit der generierten bzw. erhobenen Daten sicherzustellen. Das Forschungsdatenmanagement (FDM) bezieht sich auf den gesamten Prozess der Verwaltung von Forschungsdaten während ihres Lebenszyklus. Ein Datenmanagementplan (DMP) unterstützt Sie bei einem strukturierten Vorgehen (s. unten). 

Phasen des Datenlebenszyklus:

  • Planung: Festlegung der Anforderungen für die Datenerfassung, einschließlich des Datenformats, der Datenerfassungsmethoden, des Speicherortes, der Größe des benötigen Speichervolumens, sowie die Lokalisierung bereits vorhandener Daten.

  • Erzeugung: Datenerfassung inklusive des Einholens der Datennutzungserlaubnis.

  • Auswahl: Bewertung der gesammelten Daten, um sicherzustellen, dass sie den wissenschaftlichen Standards entsprechen.

  • Auswertung: Analyse und Interpretation der Daten, um Erkenntnisse zu gewinnen und Forschungsfragen zu beantworten.

  • Veröffentlichung: Speicherung und Zugänglichkeit der ausgewerteten Daten für Dritte. Dies kann an verschiedenen Speicher- und Ablageorten erfolgen.

  • Aufbereitung für die Nachnutzung: Bereitstellung von Metadaten, Auswahl geeigneter Zugangsrichtlinien und Anpassung der Daten für die Wiederverwendung.

Warum FDM?

  • Ziel ist die Sicherung der guten wissenschaftlichen Praxis, wie sie in der entsprechenden Ordnung zur Sicherung guten wissenschaftlichen Praxis der KU verankert ist. Leitmotiv ist die Nachvollziehbarkeit der Forschungsergebnisse, die eine Reproduzierbarkeit erlaubt. Dies gewährleistet die Glaubwürdigkeit der eigenen Forschung gegenüber Dritten. Durch die Möglichkeit, die Ergebnisse zu verifizieren bzw. reproduzieren, wird das Vertrauen in die wissenschaftliche Arbeit gestärkt. Ein Aspekt, der im Zusammenhang mit der sogenannten Replikationskrise, besonders präsent geworden ist.
  • Erfüllung der Vorgaben von Forschungsförderern und Verlagen (für weitere Details s. unten): Diese fordern die Einhaltung von Richtlinien bezüglich der Dokumentation, Archivierung und Zugänglichkeit der erzeugten bzw. genutzten Forschungsdaten. Dies dient nicht nur als Anreiz, sondern ist vielfach auch zwingend erforderlich – die Transparenz der Daten erfolgt selbstverständlich unter Berücksichtigung weiterer Aspekte wie etwa dem Datenschutz.
  • Minimierung des Risikos von Datenverlusten: Eine sorgfältige Datensicherung und -archivierung ist unerlässlich, um die Integrität und Verfügbarkeit der Daten langfristig zu gewährleisten. Dies schützt nicht nur vor unvorhergesehenen Ereignissen, sondern trägt auch zur Vermeidung von Informationsverlusten bei.
  • Steigerung der Sichtbarkeit und Reputation: Eine verbesserte Zugänglichkeit Ihrer (Meta-)Daten erhöht die Zitationsraten, stärkt Ihre wissenschaftliche Sichtbarkeit und Reputation innerhalb der wissenschaftlichen Gemeinschaft.
  • Nachnutzung: Nicht zuletzt ermöglicht die Nachnutzung von Datensätzen das Generieren neuer Erkenntnisse sowohl im eigenen als auch in anderen Fachbereichen.
  • Schließlich leisten Sie durch das FDM ihren Beitrag zu Open Science.

Anforderungen von Förderinstitutionen und Verlagen

Drittmittelgeber

Immer mehr Forschungsförderorganisationen erwarten bereits im Rahmen des Förderantrages einem Datenmanagementplan (z.B. DFG, BMBF EU, VW Stiftung etc.). Konkrete Anforderungen finden Sie in der Regel auf den Webseiten der Forschungsförderer.

Eine Übersicht über Anforderungen der Forschungsförderer hinsichtlich Open Data bietet die Datenbank SHERPA Juliet.

Vorgaben einiger Förderinstitutionen in Bezug auf Forschungsdatenmanagement:

  • Deutsche Forschungsgemeinschaft (DFG)
  • Bundesministerium für Bildung und Forschung (BMBF)
    • Datenmanagementplan (DMP): Kein formalisierter DMP, aber ausführliche Beschreibung des Datanmanagements im Rahmen der Projektbeschreibung nötig.
    • Wo veröffentlichen? Datenablage in einem Repositorium
    • Wann veröffentlichen? In der Regel nach Abschluss des Projektes
    • Übernahme der Kosten: Abhängig von der Ausschreibung
    • Weitere Informationen: Verweis auf Verbund Forschungsdaten Bildung (VDB)
  • Volkswagen-Stiftung
    • Datenmanagementplan (DMP): Erforderlich
    • Wo veröffentlichen? In einem vertrauenswürdigen Repositorium eigener Wahl.
    • Übernahme der Kosten: Zusätzliche Mittel für die Aufbereitung von entstehenden/entstandenen Forschungsdaten für bewilligte Projekte stehen zur Verfügung.
    • Weitere Informationen: Open Science Policy
  • Horizon Europe
    • Datenmanagementplan (DMP): Erforderlich
    • Wo veröffentlichen? In einem vertrauenswürdigen Repositorium eigener Wahl.
    • Wann veröffentlichen? So bald wie möglich, spätestens mit Publikation der zugehörigen Textpublikation.
    • Weitere Informationen: RDM in Horizon Europe Proposals
  • European Research Council (ERC)
    • Datenmanagementplan (DMP): Ja, ein Datenmanagementplan muss innerhalb der ersten sechs Monate der Projektdurchführung eingereicht werden.
    • Wo veröffentlichen? In einem vertrauenswürdigen Repositorium eigener Wahl.
    • Wann veröffentlichen? So bald wie möglich, spätestens mit Publikation der zugehörigen Textpublikation.
    • Weitere Informationen: Open Research Data and Data Management Plans, Information for ERC grantees
Verlage

Das Thema Forschungsdaten nimmt in den Richtlinien von Fachzeitschriften rasant zu. Einerseits unterstützen die Forschungsdaten das Reviewverfahren, andererseits sollen auch Leser/-innen auf die Daten zugreifen können:

Zu beachten ist, dass Verlage mit den Datensammlungen auch kommerzielle Interessen vertreten. Dessen sollten sich Autor/-innen bewusst sein und als Urheber/-innen darauf achten, keine exklusiven Verwertungsrechte zu erteilen.

Daten organisieren, präsentieren und nachnutzen

Datenmanagementplan (DMP)

Ein Datenmanagementplan (DMP) ist ein Instrument, das die Verwaltung des Forschungsdatenzyklus unterstützt. Er beschreibt, wie wissenschaftliche Daten während ihres gesamten Lebenszyklus gesammelt, gespeichert, verwaltet, analysiert, archiviert und geteilt werden sollen. Der Umfang dieses Dokuments kann je nach den Vorgaben der Fördergeber, dem Typ der Daten, der Größe des Projekts und der Zusammensetzung des Teams variieren, und reicht von einigen Absätzen bis hin zu mehreren Seiten. Das entscheidende Element bleibt jedoch, dass der DMP die geforderten Informationen zum Umgang mit Forschungsdaten gemäß den Richtlinien der Drittmittelgeber bereitstellt.

Ein DMP enthält in der Regel Informationen über:

  • Datenerfassung und -erzeugung: Beschreibung der Art der Daten, die generiert bzw. erhoben werden, sowie der Methoden und Werkzeuge, die für die Datenerfassung verwendet werden.

  • Datenspeicherung und -sicherung: Informationen darüber, wo und wie die Daten gespeichert werden, um ihre Integrität und Sicherheit zu gewährleisten.

  • Datenaufbewahrungsfristen: Festlegung, wie lange die Daten aufbewahrt werden müssen, um den rechtlichen und ethischen Anforderungen zu entsprechen.

  • Datennutzung und -weitergabe: Klärung, wer Zugriff auf die Daten hat, unter welchen Bedingungen und wie sie geteilt werden können.

  • Datenmanagement während der Forschung: Beschreibung, wie Daten während des Forschungsprozesses organisiert, dokumentiert und analysiert werden.

  • Metadaten und Dokumentation: Festlegung, wie die Daten dokumentiert werden, einschließlich der Erstellung von Metadaten, um anderen die Interpretation und Verwendung der Daten zu erleichtern.

  • Rechte und Lizenzen: Klärung der rechtlichen Aspekte, wie etwa Urheberrechte, Lizenzen und Datenschutzbestimmungen, die auf die Daten anwendbar sind.

  • Langfristige Archivierung und Veröffentlichung: Planung, wie die Daten langfristig gesichert und archiviert werden, sowie Möglichkeiten der Veröffentlichung und Zugänglichkeit für die wissenschaftliche Gemeinschaft.


Weitere Informationen finden Sie beispielsweise hier:

Datenbeschreibung (Metadaten)

Metadaten dienen der Beschreibung von Ressourcen, um ihre Auffindbarkeit zu erleichtern. Zu den enthaltenen Informationen gehören beispielhaft:

  • Titel
  • Autor/-innen
  • zugehörige Institution
  • eindeutige Kennungen (wie z.B. DOI)
  • Veröffentlichungsjahr
  • Thema
  • Nutzungsrechte
  • Dateinamen
  • Formate

Aufgrund der essenziellen Rolle dieser Informationen für die Datensuche wird empfohlen, standardisierte Metadatenschemata zu verwenden, um eine möglichst einheitliche und nachvollziehbare Beschreibung zu gewährleisten. Ein allgemein anerkannter Standard zur bibliographischen Beschreibung von Forschungsdaten ist das Metadatenschema von DataCite. Dieses legt verbindlich fest, welche Informationen für einen Datensatz obligatorisch anzugeben sind (z. B. Autor und Titel), welche Angaben empfohlen werden (z. B. Fachbereich und Beschreibung) und welche optional sind (z. B. Finanzierung und Nutzungsrechte). Um Forschungsdaten möglichst interoperabel zu beschreiben, stehen mit dem DataCite-Metadatengenerator und dem DataCite-Best-Practice-Guide ein Online-Werkzeug und eine konzise Handreichung zur Verfügung.

Forschungsdaten ablegen und finden

Sie können Ihre Datensätze samt Metadaten in generischen Repositorien (z.B. für Datensätze, für die noch kein passender Ablageort existiert) oder in fachspezifischen Repositorien ablegen.Aktuell akzeptieren Repositorien in der Regel kostenfrei alle Forschungsdaten, seien es Bilder, Videos, Audio-Dateien, Tabellen, Graphiken usw. Dabei gilt üblicherweise eine Speicherfrist von mindestens 10 Jahren, um den Anforderungen der guten wissenschaftlichen Praxis gerecht zu werden. Bei der Veröffentlichung wird oft vorausgesetzt, dass Daten den FAIR-Prinzipien entsprechen. Das Akronym FAIR steht für Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel) und Reusable (wiederverwendbar). Das Ziel besteht darin, Forschungsdaten so zu bearbeiten und bereitzustellen, dass sie optimal für Menschen als auch für Maschinen zugänglich sind. Gleichzeitig bedeutet dies nicht unbedingt, dass FAIR-Daten offen zur Verfügung stehen (Stichwort: Datenschutz und Anonymität der Teilnehmenden einer Befragung).

Eine zuverlässige und dauerhafte Auffindbarkeit und Zitierbarkeit der Forschungsdaten wird durch einen persistenten Identifikator (wie z.B. der DOI-Digital Object Identifier) gewährleistet, die viele Speicherorte als automatisierten Dienst anbieten. Dazu gehören auch das Thema Open Researcher and Contributor ID (ORCID) als eindeutiger Identifikator für wissenschaftliche Autor/-innen sowie das Research Organization Registry (ROR) für Institutionen, wo die KU bereits eingetragen ist.

Von Seiten der Forscher/-innen ist die Auswahl der jeweils passenden Speicherlösung relevant. Faktoren wie Nutzungsbedingungen, Rechte an den Datensätzen, akzeptierte Dateiformate, Kosten usw. sind bei der Auswahl zu berücksichtigen. Suchsysteme wie Registry of Research Data Repositories (re3data.org), OpenDOAR, FAIRSharing oder RIsource (DFG-Plattform) unterstützen bei der Suche nach einem geeigneten Speicherort und der Recherche nach spezifischen Datensätzen. Außerdem bieten sowohl sogenannte fachspezifische  Fachinformationsdienste als auch die im Rahmen der Nationalen Forschungsdaten Infrasktruktur (NFDI) gegründeten fachorientierten Konsortien Forscher/-innen Beratung, Dienste und Werkzeuge rund um Forschungsdaten an.

Darüber hinaus existieren spezialisierte Datenjournale (Data Journals), die sogenannte Datenartikel (Data Paper) veröffentlichen und in der Regel auf bestimmte Disziplinen hin ausgerichtet und meistens im Open Access verfügbar sind. Datenartikel umfassen eine detaillierte Beschreibung von Datensätzen (inkl. verwendeter Methoden, Art der Bearbeitung usw.) und präsentieren darüber hinaus keine Forschungsergebnisse. Das Hauptziel eines Datenjournals ist es, einen raschen Zugang zu qualitätsgeprüften Datensätzen zu ermöglichen sowie deren Wiederverwendbarkeit zu fördern und ihre Sichtbarkeit zu erhöhen. Eine Liste von Datenjournalen finden Sie auf: Zenodo, forschungsdaten.org oder Data Journals Archive.

Forschungsdaten nachnutzen/nachnutzbar machen: rechtliche Rahmenbedingungen

Bevor Daten veröffentlicht werden, müssen alle notwendigen Einwilligungen eingeholt und dokumentiert werden, insbesondere in Bezug auf die Nutzung von Materialien Dritter und schützenswerter Informationen. Darüber hinaus soll eine Lizenz für die Nachnutzung der Forschungsdaten durch Dritte vergeben werden. Eine Lizenz stellt eine vertragliche Vereinbarung dar, mittels derer Nutzungsrechte eingeräumt werden.  Sie erlaubt verschiedene Nutzungsarten wie das Kopieren, Speichern, Verlinken und Veröffentlichen von Daten, insbesondere im Zusammenhang mit urheberrechtlich geschützten Werken.

Es wird empfohlen, freie Lizenzen zu verwenden (CC-0, CC-BY), die die kostenlose Nutzung des Werkes erlauben und somit die uneingeschränkte Zugänglichkeit Ihrer Forschungsergebnisse gewährleisten. Für Datensätze, die aus Gründen des Persönlichkeitsschutzes nicht frei verfügbar gemacht werden können, bieten i.d.R. Speicherorte ein gestaffeltes System für Rechte und Zugriff. Es besteht außerdem die Möglichkeit, die Veröffentlichung der Datensätze zu einem späteren Zeitpunkt durch Sperrfristen zu planen (Embargo). In beiden Fällen werden auf Repositorien nur die Metadaten abgelegt und sichtbar sein, um Dritte über Ihr Vorhaben zu informieren. Hier finden Sie eine Übersicht über Creative Commons Lizenzen sowie ein Unterstützungstool für die Suche nach der passenden Lizenz. 

Beispiele für Repositorien

Beispielhaft sind gängige Ablageorte aufgeführt, die Sie frei auswählen können. Wir unterstützen Sie gerne dabei, das für Ihre Datensätze passende Repositorium zu finden.

FDM an der KU: So unterstützen wir Sie

Beratung und Schulungen

Die FDM-Beratungsstelle unterstützt Sie individuell bei:

  • Beratung zu FDM-Anforderungen für Fördermittelanträge
  • Erstellen von Datenmanagementplänen
  • Datenschutz und Datensicherheit an der KU
  • Zwischenspeicherung und Backup für Ihre Daten während Ihres Forschungsvorhabens
  • Auswahl geeigneter Datenformate
  • Datenbeschreibung (Metadaten)
  • Suche nach einem passenden Ablageort
  • Hilfe bei der Lizenzvergabe
  • Info über Embargomöglichkeiten
  • Nachnutzung Daten von Dritten
  • sonstige rechtliche Fragen rundum Forschungsdaten
  • Einhalten ethischer Aspekte
     

(Online-)Schulungen werden regelmäßig angeboten:

Kollaboratives Arbeiten und Zwischenspeicherung

Das Universitätsrechenzentrum stellt verschiedene technische Möglichkeiten sowohl für das kollaborative Arbeiten als auch für die Zwischenspeicherung Ihrer Daten zur Verfügung. Für sonstige ad hoc Lösungen sprechen Sie uns an.

Nützliche Links

Die Relevanz des Themas unterstreichen unter anderem die folgenden fachlichen Handreichungen, Empfehlungen und Stellungnahmen:


Weitere Informationen und Materialien erhalten Sie u.a. hier:

FDM-Team

E-Mail: fdm(at)ku.de

Sie erreichen damit unser FDM-Team, dass Ihr Anliegen gern aufgreifen wird:

Letzte Aktualisierung: 2024-02-28