Arbeitskreis Forschungsdaten

Admin

Posters und Demos

Thema Abstract Typ
Datenmanagement

Leibniz-Institut für Ostseeforschung Warnemünde (IOW)

Susanne Feistel

Das IOW entwickelt ein modulares Datenmanagementsystem, um die im Haus erhobenen Forschungsdaten in geeigneter Form zu speichern, zum Beispiel in individuell konzipierten Datenbanken oder in indizierten Dateisystemen. Das Spektrum an Daten umfasst dabei georefenzierte Punktdaten, Modelldaten zu Ökosystemen, Biologische Daten, Kartendarstellungen und vieles mehr. Ein Metadatenkatalog dient dazu, eine Suche über alle zur Verfügung stehenden Datenquellen zu ermöglichen und den Nutzer zu den gewünschten Daten zu führen. Poster

Addendum

Datenmanagement

Leibniz-Institut für Plasmaforschung und Technologie e.V. (INP Greifswald)

Markus Becker, Steffen Franke, Lucian Paulet

The interdisciplinary nature of current research in the field of plasma technology gives rise to the question of how research results in the different fields of science (physics, chemistry, biology, medicine and very recently agriculture) can be effectively linked together and made accessible and reusable for scientists and industry in the different fields. The project InPT-Dat (Interdisziplinäre Plasmatechnologie- Datenplattform) aims to tackle this question. The goal of this project is to establish a web-based research data management platform for the collection and provision of research data from all fields of low-temperature plasma science and to sensitize researchers for a handling of research data according to the FAIR (Findable, Accessible, Interoperable, Reusable) principles. Poster
Datenmanagement

ZPID – Leibniz-Zentrum für Psychologische Information und Dokumentation

Ronny Bölter

DataWiz ist ein kostenfreies Open-Science Assistenzsystem, das Wissenschaftlern und Wissenschaftlerinnen aus der Psychologie dabei hilft, Forschungsdaten vom Beginn des Forschungsprozesses an fachgerecht aufzubereiten und zu dokumentieren. Diese Unterstützung beinhaltet zum einen die kontextsensitive Bereitstellung von Informationen zu üblichen Problemstellungen des Forschungsdatenmanagements aus einer Wissensbasis. Zum anderen findet über den gesamten Forschungszyklus hinweg eine prozedurale Unterstützung der Forschenden bei der Bewältigung forschungsdatenmanagementbezogener Aufgaben statt. DataWiz assistiert projektbegleitend u.a. bei der Verfassung von Datenmanagementplänen, bei der Dokumentation erhobener Forschungsdaten, bei der Sicherung der Forschungsdaten, bei der Vergabe von Zugriffsrechten und bei der Übergabe an externe Datenarchive. Software-Demo
Datenmanagement

Herder-Institut für historische Ostmitteleuropaforschung

Stephanie Palek

Das Poster stellt die Arbeitsbereiche des Herder-Instituts im Zusammenhang mit dem Datenlebenszyklus vor. Das Herder-Institut verfügt über zahlreiche Arbeitsbereiche (Bildarchiv, Dokumente- und Kartensammlung, Bibliothek, Softwareentwicklung), die in unterschiedlichem Umfang und auf unterschiedliche Weise Daten und Anwendungen produzieren, auf die die weitere Produktion von Forschungsdaten aufbaut, weshalb das HI mit einem weiten Begriff von Forschungsdaten operiert. Dies bedeutet auch, dass das Forschungsdatenmanagement in alle Bereiche hineingreift und teils individuelle Lösungen für die Problembereiche der Reversibilität, Nachvollziehbarkeit, Nachnutzung und Datenpublikation finden muss. Das Poster benennt die Schnittstellen zwischen Forschungsprozess und Datenproduktion und thematisiert, wie das am Herder Institut ansässige BMBF-Projekt dieser Aufgabe begegnet und welche die angestrebten Ziele des Projektes sind. Poster
Datapublication and Archiving

Leibniz-Institut für Astrophysik Potsdam (AIP)

Anastasia Galkin

At the Leibniz-Institute for Astrophysics Potsdam (AIP) we gained profound experience in publishing astrophysical data for numerous projects and international collaborations. While a project web application requires dedicated websites with a specific look and feel, the process of publishing a data release has common steps of data aquisition, data curation and publishing. We have build up a software stack, processes and tools for each of the steps.
The astrophysical data published by AIP comes either from observation or from cosmological simulations. The raw data from observations is transferred to the computational cluster where we have built up a collaborative research environment which supports the scientists from all over the world to process the data. The end product data is checked and curated with the use of scripts and ingested into SQL databases via ASCII Ingestor. The data releases are then published on dedicated websites.
The Daiquiri software stack has now been released in its second incarnation based on the Python Django framework. The data sets are
stored in SQL databases and published either to the public or a restricted groups of researchers. Access is possible via an interactive SQL query interface or via scripted access. The queryparser package is part of the Daiquiri framework and allows to query the data using the native backend SQL language as well as ADQL (Astrophysical Data Query Language). Currently, MySQL and PostgreSQL are supported. Each user has her/his own private tablespace where the results of all queries are stored and can be retrieved and downloaded any time. Along with the data access, Daiquiri supports user management, contact messages and meetings management as well as an integration of WordPress for documentation and project presentation. Daiquiri consists of a common code base, which is centrally maintained, and site-specific applications, which are highly customizable to the project requirements.
Daiquiri is open source software and is licensed under the Apache License 2.0. The source code is available on GitHub: https://github.com/aipescience/django-daiquiri
Poster
/ Demo
Datenmanagement, Werkzeug

Leibniz-Institut für Astrophysik Potsdam (AIP)

Olaf Michaelis

RDMO ist ein Werkzeug zur strukturierten Planung und Umsetzung des Forschungsdatenmanagements in wisseschaftlichen Projekten, welches die Ausgabe eines Datenmanagementplans (DMP) ermöglicht. RDMO ist jedoch auch über den Antragsprozess hinaus von Nutzen, da es alle relevanten Planungsinformationen erfasst und in der Lage ist, über den gesamten Datenlebenszyklus alle Datenmanagementaufgaben zu verwalten. (https://rdmorganiser.github.io/)
Es begleitet Projekte während der gesamten Projektlaufzeit. Ausgehend von strukturierten Interviews und den betroffenen Datensätzen, organisiert RDMO das Datenmanagement anhand von Aufgaben und bindet alle relevanten Akteure wie beispielsweise Forschende, Datenmanager, IT oder die Bibliothek ein.
Zu den Kernfunktionalitäten von RDMO zählen:
– zentrale Verwaltung von Informationen zum Forschungsdatenmanagement
– anpassbare Frage- und Antwortvorlagen
– leicht anpassbares Design
– fortlaufende Aktualisierbarkeit und Versionierung von Informationen im Verlauf eines Projekts
– Unterstützung für Multilingualität (deutsche und englische Bedienoberfläche sind integriert)
– Ausgabeformate für diverse Zwecke, u.a. für unterschiedliche Datenmanagementpläne, je nach Vorgaben der Förderer
Poster / Demo
Datenmanagement, Datenhaltung

Museum für Naturkunde Berlin

GDM – generic data module: The Generic Data Module is a web based graphical user interface on top of a MySQL / MariaDB database that allows the users to browse and edit data without any SQL knowledge. The User Interface is generated depending on the provided data model. Due to its complexity the user is expected to have a minimum of knowledge on how tables are connected in relational databases. Poster
Datenmanagement, Datenhaltung f. Sammlungen

Museum für Naturkunde Berlin

Jana Hoffmann

DINA – DIgital Information System for NAtural History Data: Es gibt zahlreiche Datenmanagementsysteme für naturkundliche Sammlungen. Doch durch die Diversität der Themenfelder kann kein monolithisches System alleine alle langfristigen Anforderungen der unterschiedlichen Sammlungen und der assoziierten Forschungsarbeit abdecken.
Das DINA Konsortium (“”DIgital Information System for NAtural History Data””, https://dina-project.net) stellt sich diesen Herausforderungen mit einem Open-Source System, das auf dem Prinzip webbasierter Microservices beruht. Dem Community gesteuerten Entwicklungsprozess des DINA „Ökosystems‘‘ liegt eine Zusammenstellung umfangreicher Richtlinien (v.a. für gemeinsame Webschnittstellen) zu Grunde, um die Interoperabilität der Dienste zu sichern. Dieses Prinzip ermöglicht es, existierende Webdienste DINA kompatibel zu gestalten, ohne Funktionalitäten redundant zu entwickeln. Gleichzeitig können die Institutionen nur diejenigen Dienste installieren, die sie in Ihren Anwendungsfällen benötigen.
Poster
Datenmanagement, mobile Datenerfassung

Museum für Naturkunde Berlin

Günther Korb

LotManager: Ein digitaler Datenworkflow für die Biodiversitätsentdeckung: Der LotManager ist eine Anwendung, die eine Brücke zwischen der Sammlungstätigkeit im Feld und dem Sammlungsmanagement im Museum schlägt. Er ist der zentrale Baustein eines digitalisierten Datenflusses, der mit der mobilen Datenerfassung des Sammlungsereignisses beginnt und Sammlernamen, Standortkoordinaten, Datum und Uhrzeit, QR-Codes, Fotos sowie ergänzende Textinformationen zu Habitat und Traits umfasst. Vom mobilen Gerät in einen Webserver hochgeladen, auf dem der LotManager Zugriff hat, werden die Daten unterschiedlicher Sammler aggregiert. Überführt in ein lokales Repository können die Daten mit dem LotManager weiterbearbeitet, insbesondere die in Lots zusammengefassten Sammlungsobjekte separiert und bestimmt werden. Da dieser Bearbeitungsprozess vom LotManager lückenlos erfasst wird, ist er ein geeignetes Instrument für die neuen Anforderungen an die Dokumentation des Erwerbskontextes und der Biographie der Sammlungsobjekte. Über Schnittstellen lassen sich die Daten in ein Sammlungsmanagementsystem überführen, für Web-Präsentationen nutzen und für das DNA Barcoding aufbereiten. Poster
Datenmanagement

Institut für Deutsche Sprache (IDS)

Denis Arnold

Repositorysoftware für Sprachressourcen. Erfahrungen: Das Institut für Deutsche Sprache betreibt derzeit ein Repository auf Basis von Fedora, das gleichzeitig als eine technische Basis für ein Datenzentrum im Rahmen von CLARIN dient. Das Poster skizziert die allgemeinen Anforderungen eines Repositoriums in diesem Kontext. Mit dem Wandel der Fedora-Architektur stehen derzeit zusätzliche Herausforderungen an. Poster
Forschungsinformations-Systeme

Heinrich Pette Institute
Leibniz-Institute for experimental Virology (HPI)

Kerstin Haller

Probleme mit Forschungsinformationssystemen am Beispiel von Converis 5.5 am HPI Poster
Datenmanagement

Leibniz-Institut für Gewässerökologie und Binnenfischerei (IGB)

Simone Frenzel, Daniel Langenhaun

Seit Anfang 2018 steht die neue IGB Forschungsdatenbank zur Archivierung und zum Austausch von Umweltdaten offiziell zur Verfügung. Datensätze werden in FRED innerhalb von Paketen organisiert. Jedes Paket kann mit Eigenschaften wie Titel, Untersuchungsgebiet, Probennahmeorte und gemessenen Parametern, ausgezeichnet werden. Innerhalb der Pakete können Metadaten im pdf Format und Daten als Excel (bzw. CSV) Dateien abgelegt werden. Pakete können mit einer DOI versehen, veröffentlicht werden.
Weiterhin besteht die Möglichkeit, den Inhalt der Datenfiles mit einem Parser (basierend auf der Bibliothek phpOffice) direkt in die Datenbank zu importieren. Damit lassen sich Forschungsdaten im System zusammensetzen, durchsuchen und verknüpfen. Gerade im Hinblick auf die Anforderungen von Langzeitmonitoring können so Datensätze über viele Jahre hinweg in der Datenbank aufgebaut und gepflegt werden.
Durch semantische Annotation soll gewährleistet werden, dass Pakete auch dann beim suchen gefunden werden können, wenn bei ihrer Auszeichnung andere Begriffe verwendet wurden als in der Suchanfrage.
Poster