Arbeitskreis Forschungsdaten

Admin

Disziplinspezifisches Projekt

Moderation: Jan Goebel, Harry Enke

Die Gruppe war stark von sozial- und wirtschaftswissenschaftlichen Teilnehmern geprägt, die Diskussion war daher auf die für diese Fälle spezifischen Items fokussiert.
Voraussetzung: die Forschungsfrage steht fest
Zu Projektanfang:

  • Datenquellen:
    • vorhandene Daten, Infrastrukturen (z.B. BA, Rentenversicherungsträger, Statistische Ämter), SOEP,….
    • Neuerhebungen  :: bei Neuerhebungen ist ein erhebliches ‘Preprocessing’ mit einzukalkulieren
  • Ansatz für die Daten:
    • quantitativer Ansatz
    • qualitativer Ansatz :: extensives Preprocessing erforderlich fuer die spätere Nutzbarkeit der Daten, Methodik ist extrem individuell geprägt
    • mixed Methods Ansatz
  • Datenstrukturen und -formate
    • Abklärung von Methoden und Begrifflichkeiten
    • kontrollierte Vokabulare, Erschliessungsvokabulare
    • Statistische Konventionen
    • Qualitative Daten meist textuell(+ Ton- und Bildaufzeichnung)
    • Quantitative Datenformate können bei korrekter Dokumentation immer transformiert werden

In der Projektlaufzeit:

  • zu beachtende Probleme:
    • Abgrenzung von wissenschaftlicher Arbeitweise und Datenmanagement
    • Einbringen von Daten in gemeinsamen Datenpool versus individuelle Datenhaltung (auch aus rechtlichen Gründen)
    • zentrale versus dezentrale Datenhaltung
    • Vorgaben für gemeinsame Datenstrukturen und Verfahren? Beispiel: Vorgaben BA, Statisitik-Ämter
    • Qualitätsmanagement
    • Struktur der Resultate des Projekts schon von vornherein festhalten
    • Dokumentation der Arbeiten im Projekt

Für das Projektende:

  • Welche Daten können veröffentlich werden
  • Welche Daten sollen veröffentlich werden
  • Zu welchem Zweck werden die Daten nachgehalten? Nachweis guter wiss. Praxis versus Nachnutzung
  • Welche Daten müssen gelöscht werden
  • Welches Institut oder Repository kommt für die nachhaltige Datenberöffentlichung in Frage?
  • Gibt es Möglichkeiten, zu löschende Daten (SUF etc) bei den Datenzentren (s. oben Infrastrukturen) so zu kennzeichnen und zu sichern, dass Nachvollziehbarkeit trotz Löschungspflicht gewährleistet ist?
  • Können die Metadaten öffentlich zugänglich gemacht werden?
  • Zeithorizont des Nachhaltens der Daten

Gesamt-Projektfragen:

  • Bereitstellung von Personal für Datenhaltung und Datenmanagement:
    • muss fachlich qualifiziert sein
    • Bruchteile von FTE (eg 3 Monate FTE für Datenmanagement) sehr problematisch, da nicht in Personal einfach umsetzbar
    • kleine und mittlere Institute können das nicht machen derzeit
    • Verlagerung in IT/Bibliothek nicht sinnvoll bzw. erfüllt nicht fachliche Anforderungen
    • sollte nicht nebenbei von Projektmanagement und/ oder Stud. Hilfskraft gemacht werden
  • Legale und andere Auflagen
    • Datenschutz Gesetze
    • Informed Consent, insbesondere auch in Hinblick auf mögliche Veröffentlichung/Nachnutzung checken
    • Vertrauensschutz (bei Befragungen, Interviews, betrieblichen Daten, ….)
    • Anonymisierung

Die Stichpunkt geben den Verlauf der Diskussion natürlich nur ansatzweise wieder. Ergänzungen etc. willkommen.