Arbeitskreis Forschungsdaten

Admin

Sektion A

Zusammenfassung der Diskussion in Sektion A

Moderation: Armin Günther & Bianca Pramann

An der Diskussion nahmen zehn Teilnehmerinnen und Teilnehmer aus der Sektion A teil. Fachlich gab es einen Schwerpunkte bei der Pädagogik und Psychologie auf der einen Seite, sowie Geschichtswissenschaft und Archäologie auf der anderen Seite. Die Diskussion orientierte sich an den vorgegebenen Fragen, konnte allerdings innerhalb der gegebene Zeit nur einen Teil ausführlicher thematisieren.

Welche Daten fallen in Ihrem Institut an?
Entsprechend dem fachlichen Spektrum der Teilnehmer erstecken sich die anfallenden Forschungsdaten von qualitativen sozialwissenschaftlichen Daten (z. B. Interviewdaten) bis hin zu naturwissenschaftlichen Messdaten wie sie z. B. in der Archäologie aber auch der Psychologie (z. B. Biodaten) Verwendung finden. Diese Vielfalt an Datenformaten wird vor allem dann zum Problem, wenn sie innerhalb einer Disziplin bzw. eines Instituts anfallen (“Leiden an der Datenvielfalt”), da sie die Bewältigung sehr heterogener technischer (z. B. offene vs. geschlossene/proprietäre Dateiformate; unterschiedliche Speichermedien), inhaltlicher (z. B. Dokumentation/Metadaten), ethischer und rechtlicher (z. B. Anonymisierung von Videodaten) etc. Anforderungen verlangen. Teilweise stellte sich die Frage, was überhaupt als Forschungsdaten anzusehen und entsprechend zu behandeln ist: bereits die “Ursprungsaufzeichnungen” (z. B. Videoaufnahmen von Unterrichtseinheiten, Digitalisate von Texten) oder erst die daraus gewonnenen Messwerte (z. B. die erfasste Anzahl bestimmter Ereignisse). Auch wenn eine möglichst umfassende Dokumentation der Datengenese grundsätzlich als wünschenswert erschien, wurde auf die Notwendigkeit verwiesen, die Datenarchivierung nicht zuletzt aus pragmatischen Gründen (begrenzte Ressourcen) auf das jeweils Handhabbare zu begrenzen.

In welchem Format werden anfallende Daten gespeichert und gibt es dafür in Ihrer Community anerkannte Standards?
Entsprechend der qualitativen Vielfalt von “Forschungsdaten” (s. o.) fallen auch die Speicherformate und Dokumentationsstandards (sofern vorhanden) sehr unterschiedlich aus. Deutlich wurde in der Diskussion, dass proprietäre Dateiformate immer wieder ein Problem darstellen, ebenso wie eigentlich notwendige, faktisch aber oft nicht realisierte technische Erhaltungsmaßnahmen etwa durch die Portierung auf aktuelle Softwareversionen. Selbst dort, wo es offene Speicherformate gibt (z. B. durch Export der Daten aus proprietären Formaten in einfache Textformate), wurde die fehlende (Bereitschaft zur) Verwendung dieser Formate beklagt. Dokumentationsstandards wurden in der Diskussion nicht genannt, es entstand vielmehr der Eindruck, dass vielfach “Standards” selbst entwickelt und definiert werden müssen.

In welchem Kontext fallen diese an (projektbasiert, kontinuierlich auf Ebene von Abteilungen, Institut, etc.)?
Dies war bei den vertretenen Instituten sehr unterschiedlich. Während bei einigen Instituten Forschungsdaten primär im Rahmen kleinerer (individueller) Projekte anfallen und der primäre Output in Publikationen von Forschungsresultaten gesehen wird, ist bei anderen Instituten die Erfassung, Dokumentation und Bereitstellung von Forschungsdaten zentrale Aufgabe der Einrichtung. In der Konsequenz unterscheiden sich diese Institute teilweise erheblich im Hinblick auf den Stellenwert eines institutionalisierten Forschungsdatenmanagements.

Wofür werden die Forschungsdaten genutzt (intern, Weitergabe an Dritte, Publikation)?
Entsprechend der unterschiedlichen Kontexte, in denen Forschungsdaten anfallen, ist auch die Nutzung sehr heterogen. Teilweise beschränkt sich diese auf die Auswertung für individuelle Publikationen. Bei Instituten, die ein Forschungsdatenzentrum betreiben, ist demgegenüber die wissenschaftliche aber auch nicht-wissenschaftliche (z. B. politische oder pädagogische) Nachnutzung  relevant. Es wurde auch der Fall berichtet, dass Forschungsdatenmanagement im Institut primär als Instrument zur Dokumentation guter wissenschaftlicher Praxis (also interne Nutzung) verstanden wird, während die Weitergabe an Dritte explizit nicht angestrebt werde. Über Gründe und den Sinn einer solchen rein internen Nutzung wurde diskutiert.

Gibt es Rahmenbedingungen, z.B. rechtliche Restriktionen für den Umgang mit Ihren Daten?
Auf Rahmenbedingungen wurde in der Diskussion nur kurz eingegangen. Die Notwendigkeit ethischen und rechtlichen Erfordernissen gerecht zu werden, wurde insbesondere bei personenbezogenen Daten (Pädagogik, Psychologie) deutlich. Dies steht teilweise in Konflikt zum wissenschaftlichen Verwendungszweck (wenn z. B. die Verpixelung von Videoaufnahmen die Auswertung des mimischen Ausdrucks erschwert oder unmöglich macht). Es wurden aber auch Rahmenbedingungen genannt, die ein systematisches Datenmanagement fördern, etwa wenn durch gesellschaftspolitische Vorgaben die Datenerhebung direkt gefördert wird oder durch erschwerten Feldzugang (etwa bei Datenerhebungen in Schulen) der Nutzen zentraler, nachnutzbarer Datenarchive steigt.

Wie und auf welchen Ebenen wird Forschungsdatenmanagement in Ihrem Institut unterstützt? Welche organisatorischen Einheiten gibt es in Ihrem Institut, die sich um Daten kümmern?
Auch hier war die Situation innerhalb der teilnehmenden Institute, entsprechend des unterschiedlichen Stellenwertes von Forschungsdaten, unterschiedlich. Bei der Mehrzahl der Teilnehmer herrschte allerdings der Eindruck vor, dass das Forschungsdatenmanagement nach wie vor zu wenig durch die Leitung der Institute aber auch von Seiten der WGL gefördert und gefordert wird (“Lippenbekenntnis”). (Grassroots-)Initiativen “von unten” blieben so ohne nachhaltige Wirkung. Selbst wo es eine detaillierte Datenmanagement-Policy im Institut gibt (ein Fall, der allerdings bei den Teilnehmern offenbar eher die Ausnahme war), wurde beklagt, dass diese nicht mit dem erforderlichen Nachdruck umgesetzt werde. In diesem Zusammenhang wurde auch die Bereitschaft der Wissenschaftler, entsprechende Regelungen und Standards umzusetzen diskutiert. Hier wurde auf der einen Seite ein nach wie vor fehlendes Bewusstsein, das Fehlen von Anreizen und institutionalisierter/sanktionierter Standards betont, auf der anderen Seite aber auch berichtet, dass dort, wo Wissenschaftler den Nutzen eines systematischen Datenmanagements in ihrer eigenen Arbeit erfahren konnten, die Unterstützung erkennbar wächst.