Zwei neue Datenmanagerinnen am MDC
Wissenschaftler*innen erheben und speichern sie auf Laptops oder Servern, tragen sie in ein Laborbuch ein, verschicken sie per E-Mail oder laden sie in eine Datenbank hoch: Wissenschaftliche Daten in allen Größenordnungen sind eine Grundlage der Forschung – und es werden immer mehr. Je strukturierter Forscher*innen am MDC ihre Daten verwalten, desto einfacher ist es für andere, sie wiederzuverwenden, die Zusammenarbeit zu verbessern und Entdeckungen anzustoßen.
Die Aufgabe, Forschungsdaten zu analysieren, zu sichern, zu veröffentlichen und zu teilen, wird in den Lebenswissenschaften immer komplexer.
Ein neues Team am MDC soll sich nun ausschließlich mit dem Thema Forschungsdatenmanagement befassen: Dr. Sara El-Gebali und Dr. Özlem Özkan entwickeln Konzepte und Regeln für den Umgang mit wissenschaftlichen Daten am MDC und setzen sie anschließend um. Dabei müssen sie sich gleichzeitig nach den Anforderungen des Instituts und den Bedürfnissen der Forschenden richten. Außerdem orientieren sie sich an internationalen Richtlinien.
Datenmanagement ist wertvoll
Wie viele andere Forschungszentren muss das MDC den Zugang zu Forschungsdaten sicherstellen und die Datensicherheit erhöhen. Dabei müssen institutseigene Datenschutzrichtlinien berücksichtigt werden. „Die Aufgabe, Forschungsdaten zu analysieren, zu sichern, zu veröffentlichen und zu teilen, wird in den Lebenswissenschaften immer komplexer. Alle Zentren der Helmholtz-Gemeinschaft beschäftigen sich mit dieser Aufgabe und im Speziellen auch die Gesundheitsforschungszentren“, sagt Dr. Jutta Steinkötter, Bereichsleitung Wissenschaftliche Infrastruktur. El-Gebali leitet das neue Research Data Management-Team (RDM) und ergänzt: „Die Europäische Kommission schätzt, dass sich der monetäre Verlust von Daten, der auf Grund von Problemen bei ihrer Wiederverwertung entsteht, auf rund 10 Milliarden Euro pro Jahr beläuft – und dies allein im akademischen Sektor.“ Deshalb würden Institutionen jetzt mehr ins Research Data Management investieren.
Die Europäische Kommission schätzt, dass sich der monetäre Verlust von Daten, der auf Grund von Problemen bei ihrer Wiederverwertung entsteht, auf rund 10 Milliarden Euro pro Jahr beläuft – und dies allein im akademischen Sektor.
Das neue RDM-Team konzentriert sich zunächst darauf, eine Strategie und einen Fahrplan für das MDC weiterzuentwickeln. Damit setzen sie die Arbeit ihrer Kollegin Dr. Julia Haseleu fort, die in der Vergangenheit gemeinsam mit einem externen Berater die Grundlage für ein Modell für Forschungsdatenpolitik und gute Datenpraxis am MDC entwickelt hat.
Workflows effizienter machen
Als zentrale Anlaufstelle zu allen Fragen zum Datenmanagement arbeiten El-Gebali und Özkan an der Schnittstelle zwischen Forschung, Infrastruktur, IT, Datenschutz und Bibliothek. Gemeinsam mit den Wissenschaftlerinnen und Wissenschaftlern am MDC wollen sie die Arbeitsabläufe in der Forschung so effizient wie möglich gestalten. Dazu gehören eine solide wissenschaftliche Recheninfrastruktur, technische Lösungen und andere Mittel und Wege, damit Forschende die Daten bestmöglich analysieren, speichern, beschreiben, verarbeiten und widerverwerten können.
Um auf ein großes Mikroskop-Bild zuzugreifen, wäre beispielsweise eine virtuelle Maschine geeigneter als ein einfacher Rechner mit kleinerer Rechenleistung. So wäre ein reibungsloser Datenaustausch zwischen den Geräten möglich, ohne dass dabei Daten verloren gingen. „Am MDC stehen zudem die Knoten des High Performance Computer Clusters zur Verfügung“, sagt Karsten Häcker, Leiter der Zentralen IT. „Darauf können mehrere hundert Bilder gleichzeitig ausgewertet werden – oder kleinere Kacheln als Ausschnitt von sehr großen Bildern.“
Wir können vor der Veröffentlichung der Daten Hinweise geben, welche beschreibenden Daten und Metadaten notwendig sind, damit die Daten wiederverwendet werden können.
Künftig sollen solche Prozesse auch durch einheitliche Standards für Metadaten ergänzt werden. Will eine Arbeitsgruppe ihre Daten öffentlich machen, liefern beschreibende Daten das nötige Hintergrundwissen, um sie interpretieren zu können. Für die Analyse des Mikroskop-Bildes sind beispielsweise Informationen über die Geräte-Einstellungen, den begutachteten Gewebetyp, das Alter des untersuchten Versuchstieres und vieles mehr entscheidend. „Wir können zum Beispiel vor der Veröffentlichung der Daten Hinweise geben, welche beschreibenden Daten und Metadaten notwendig sind, damit die Daten wiederverwendet werden können“, sagt Özkan. Gemeinsam mit Häcker will das Team einheitliche Nutzungskonzepte entwickeln, die den Forschenden entweder klare Richtlinien oder automatisierte Datenverwaltungsprozesse vorgeben.
Trainings und Schulungen
Das Team bietet Forschenden auch Hilfestellungen an, wenn wissenschaftlichen Veröffentlichungen anstehen, einschließlich der Lizenzierung, Fragen zum Urheberrecht, der Art und Weise des Zitierens und wie, wo und welche Daten hinterlegt werden können. Bei diesen und anderen Themen ermutigen El-Gebali und Özkan die Forschenden das Gespräch zu suchen, Fragen zu stellen und bei der Entscheidung mitzuwirken, wie das MDC mit wissenschaftlichen Daten umgehen sollte. Neben persönlicher Beratung sollen auch Trainings und Workshops stattfinden.
Beide neuen Mitarbeiterinnen haben einen wissenschaftlichen Hintergrund und bringen mehrjährige Erfahrungen im Bereich Datenmanagement mit. Özkan ist auf den Schutz von Gesundheitsdaten und genetischen Daten spezialisiert und arbeitete zuvor als Datenwissenschaftlerin bei KMPG. El-Gebali kommt aus der Krebsforschung und war bei EMBL-EBI als Datenbank-Kuratorin tätig.