Arbeitskreis Forschungsdaten

Admin

Checkliste

Checkliste aus dem WISSGrid-Projekt

 

1. Planung und Erstellung

Sind alle Rahmendaten des Projekts dokumentiert (Name, Ziele, Finanzgeber, Laufzeit, Partner, Leiter)? Wie können bereits existierende Daten integriert/nachgenutzt werden? Welche Bedeutung haben die Daten für das Vorhabensziel? Wie lassen sich die verwendeten/erzeugten Daten charakterisieren (Datenarten, Formate, Reproduzierbarkeit)? Wie werden die Daten erfasst/erstellt? Wie groß ist die Datenmenge/Produktionsrate? Wie erfolgt die Qualitätssicherung?

2. Auswahl und Aufbewahrungsdauer

Wieso müssen welche Daten aufbewahrt werden? Wann, durch wen und womit erfolgt die Datenauswahl? Wie lange müssen die Daten aufbewahrt werden? Was geschieht bei Ablauf der Aufbewahrungsdauer?

3. Ingest: Einspeisen und Verantwortungsübernahme

Wann und wie werden die Daten übergeben/übertragen? Wann und von wem werden welche Metadaten erfasst? Wie werden Daten und Metadaten validiert? Wie wird mit sensiblen Daten umgegangen? Sind Rechte und Pflichten von Datenproduzent und -archiv geklärt (Protokollierung, Fehlerbehandlung)?

4. Speicherung und Infrastruktur

Wer ist während des Projekts und danach für die Speicherung der Daten verantwortlich? Mit welchen Technologien und an welchen Orten werden die Daten gespeichert? Werden regelmäßig Sicherheitskopien erstellt und überprüft? Wie hoch ist die erwartete Datenmenge? Gibt es besondere Infrastruktur-Anforderungen für Datentransfer, -zugriff und -nutzung? (Netzwerk-Bandbreite, Hardware etc.)

5. Erhaltungsmaßnahmen

Sind die eingesetzten Technologien sowie Abhängigkeiten, Nutzungszielgruppe und -anforderungen dokumentiert? Wird regelmäßig überprüft, ob sich die Anforderungen, verfügbaren Technologien oder Abhängigkeiten verändert haben? Wird die Aufbewahrungswürdigkeit regelmäßig überprüft? Gibt es eine Nachfolgeregelung bei einem Wechsel der aufbewahrenden Institution?

6. Zugriff und Nutzung

Können die Daten auch von Anderen innerhalb oder außerhalb des Projekts genutzt werden? Gibt es Verpflichtungen, Daten freizugeben oder nicht freizugeben? Welche Einrichtungen/Gruppen werden an den Daten interessiert sein? Wie werden Veröffentlichung, Suchbarkeit und Zugriff realisiert? Zu welchem Zweck und mit welcher Software werden die Daten voraussichtlich genutzt? Wie werden ggf. Erstnutzungsrecht, Nutzungsbeschränkungen oder Lizenzbedingungen durchgesetzt? Spielt Interoperabilität eine Rolle?

7. Management, Organisation und Policies

In welcher Art von Repository werden die Daten aufbewahrt? Ist der Bezugsrahmen national oder international? Welche Institutionen sind für das Datenmanagement zuständig oder daran beteiligt? Haben alle Beteiligten eingewilligt und sind deren Beiträge definiert? Ist der Workflow des Datenmanagements beschrieben? Sind alle Ressourcen beschrieben und abgeschätzt? Welche Anforderungen/Auflagen/Policies müssen berücksichtigt/umgesetzt werden? Von wem? Wie wird die Einhaltung der Planung überprüft?

8. Kosten

Wie hoch sind die Kosten und der Personalaufwand für das Datenmanagement während des Projektes / nach dem Projekt? Wer übernimmt die Kosten? Stehen alle Verantwortlichen und Beteiligten hinter den Plänen zum Datenmanagement?

9. Rechtliche Aspekte von Forschungsdaten

Sind die Daten aufgrund des Datenschutzes oder aus anderen Gründen sensibel? Werden fremde Daten oder Software verwendet, welche dem Urheberrecht, dem Patentrecht o.Ä. unterliegen? Unterliegen eigene Daten oder Software dem Urheberrecht/Patentrecht und sind die Nutzungsbedingungen und Rechte geklärt? Werden alle notwendigen Maßnahmen zum Datenmanagement eingeräumt? Sind evtl. auslaufende Schutzfristen zu berücksichtigen?

10. Metadaten

Wozu sollen die Metadaten dienen oder benutzt werden? Was soll durch Metadaten beschrieben werden? Welche Semantik und Syntax wird verwendet? Inwieweit können die Metadaten automatisch erstellt werden? Welche Voraussetzungen bestehen für die Verarbeitung und das Verständnis der Metadaten?

11. Identifikatoren und Informationsobjekte

In welchem Verhältnis stehen die Informationsobjekte zueinander? Für welche Informationsobjekte werden dauerhafte Identifikatoren benötigt? Welche Identifikatoren werden benutzt? Wie werden die Identifikatoren nachgewiesen? Wer wird die Aktualisierung und Pflege von Identifikatoren vornehmen?


Gestaltung des Forschungsdaten-Managements:

Das Forschungsdaten-Management muss so gestaltet werden, dass Datenzugriff und -auswertung unabhängig vom Datenerzeuger möglich wird und bleibt. Neben der technischen Speicherung und Lesbarkeit der Forschungsdaten müssen ausreichend Informationen zu ihrer Interpretation in Metadaten überliefert werden. Damit die Forschungen „in den Daten“ nachprüfbar bleiben und auch über mehrere Stufen veränderte Datensätze als Basis weiterer Forschungen dienen können, muss die Zuverlässigkeit der Daten sichergestellt und ihr Verarbeitungsprozess nachvollziehbar dokumentiert werden, um die Nachweiskette zu sichern. Institutionen und Personen, die Verantwortung für das Forschungsdaten-Management übernehmen, müssen bei den Fachwissenschaftlerinnen und -wissenschaftlern großes Vertrauen hinsichtlich der Archivierung und Rechteverwaltung für die anvertrauten Forschungsdaten genießen (vgl. PARSE.Insight, 2009, S. 7).

Büttner S, Hobohm HC, Müller L. Research Data Management. In: Büttner S, Hobohm HC, Müller L (Hrsg.). Handbuch Forschungsdatenmanagement. Bad Honnef: Bock + Herchen, 2011.