„Forschungsdatenmanagement ist ein Teamsport“
Falls es sie jemals gegeben haben sollte, so sind die Zeiten, in denen Wissenschaftlerinnen und Wissenschaftler ihre erhobenen Forschungsdaten ganz für sich behielten und nur mit ihren eigenen Datensätzen arbeiteten, gewiss vorbei. In der Forschung gilt es zunehmend als gute wissenschaftliche Praxis, erhobene Messdaten aus eigenen Studien weltweit der wissenschaftlichen Gemeinschaft zur Verfügung zu stellen. Mit der Frage, wie diese Datensätze optimal archiviert, aufbereitet und international für Forschungszwecke bereitgestellt werden können, beschäftigt sich das Forschungsdatenmanagement (FDM). Petra Hätscher und Dr. Elisabeth Böker schildern im Interview, warum Forschungsdatenmanagement nicht nur eine Frage der Infrastruktur ist – und warum Vernetzung auf Landes- und Bundesebene eine immer größere Rolle spielt.
Forschungsdatenmanagement gilt an Universitäten als eine der Aufgaben der Stunde. Warum eigentlich?
Elisabeth Böker: Forschungsdaten sind ein zentrales Gut für die Forschung. Sie bilden die Grundlage vieler wissenschaftlicher Studien. Viele Daten sind einmalig und können in dieser Form nie wieder erhoben werden. Durch die Langzeitarchivierung und Verfügbarmachung dieser Daten erzielen wir einen Wissenserhalt. Darüber hinaus werden durch Forschungsdatenmanagement ganz klar Kosten gespart. Forschungsteams können auf passende, bestehende Datensätze zurückgreifen, anstatt Primärdaten von neuem erheben zu müssen.
Petra Hätscher: Mit der zunehmenden Digitalisierung ist es viel leichter geworden, Daten bereitzustellen und nachzunutzen. Mit dieser Möglichkeit steigt der Anspruch in der Wissenschaft, bestehende Datensätze anderer Forschungsgruppen in die eigenen Studien einzubeziehen. Gute wissenschaftliche Praxis heißt dann auch, vorhandene Daten genutzt zu haben.
Elisabeth Böker: Die zunehmende Verfügbarmachung von bestehenden Forschungsdaten hat die Wissenschaft gestärkt. Wir sehen, dass wissenschaftliche Leistungen durch die Publikation von Forschungsdaten nicht nur überprüfbarer geworden sind, sondern dass auch ganz neue Erkenntnisse durch die Verfügbarmachung und Weiternutzung von Forschungsdaten entstanden sind. Das ist nicht nur für etablierte Forschende enorm wichtig. Auch Studierende können mit den frei verfügbaren Daten essenziellere Arbeiten schreiben als ohne den Datenbestand.
Was tut sich derzeit in Deutschland im Bereich Forschungsdatenmanagement?
Petra Hätscher: Weltweit zeichnet sich ab, dass Forschungsdaten sowohl technisch als auch organisatorisch eine große Herausforderung darstellen, da es große Datenmengen sind, die verwaltet und archiviert werden müssen. In Deutschland hat sich daher seitens Bund und Ländern die Initiative gebildet, eine Nationale Forschungsdateninfrastruktur (NFDI) aufzubauen, die länderübergreifend arbeitet – und zwar wissenschaftsgetrieben, also orientiert an den einzelnen wissenschaftlichen Communities.
Elisabeth Böker: Die NFDI baut eine verteilte und vernetzte Infrastruktur auf, die Dienstleistungen, Portfolios und Beratung für die Erzeugung, Archivierung und Nutzung von Forschungsdaten anbieten soll. Mit dem Start der NFDI im Oktober 2020 hat Deutschland einen ganz gewaltigen Schritt in Richtung der größeren Verankerung von Forschungsdatenmanagement in die Forschungsprozesse unternommen.
„Wir sind auf einem guten Weg. Ganz wichtig ist nun, dass neben Beschäftigten aus Rechenzentren und Bibliotheken auch Forschende noch stärker mit ins Boot geholt werden.“
- Dr. Elisabeth Böker
Warum gilt Baden-Württemberg als Vorreiter in diesem Prozess?
Elisabeth Böker: In Baden-Württemberg werden seit 2019 vier leistungsstarke Forschungsdatenzentren – Science Data Center – aufgebaut, die eine spezialisierte Dateninfrastruktur für vier Fachdisziplinen bereithalten. Diese Science Data Center arbeiten aber nicht nur jeweils für sich, sondern gehen die Entwicklung des Forschungsdatenmanagements gemeinschaftlich an: Jedes bringt seine Expertise mit ein. Ergänzend wurde mit dem Begleitprojekt bw2FDM ein Projekt initiiert, das sich gezielt den Querschnittsthemen der vier Science Data Center widmet. Es vernetzt die vier Science Data Center und unterstützt sie bei übergreifenden Fragestellungen. Dieses Begleitprojekt wird gemeinsam von der Universität Konstanz, dem Karlsruher Institut für Technologie (KIT) und der Universität Heidelberg aus koordiniert.
Petra Hätscher: Das Land Baden-Württemberg hat sehr frühzeitig erkannt, dass es wichtig ist, neben der technischen Infrastruktur auch Querschnittsthemen des Forschungsdatenmanagements zu fördern: Da geht es um rechtliche Fragen, um Wissensaustausch, im Kern um Vernetzung. Das Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg (MWK) ist früh darauf aufmerksam geworden, dass diese Querschnittsthemen eigene Ressourcen erfordern – und hat gesagt: Wir nehmen zusätzliches Geld in die Hand, um genau diese Vernetzungskatalysatoren zu schaffen. Das ist aus meiner Sicht wirklich klug gewesen.
Welche Querschnittsthemen sind dies?
Petra Hätscher: Was wir in der Praxis merken: Es sind immer wieder Rechtsfragen – was darf ich mit den Daten tun, wer hat die Rechte an den Daten, was darf ich wie veröffentlichen oder weitergeben? Ein Beispiel für ein weiteres übergreifendes Thema ist die Standardisierung der Beschreibung der Daten.
Sie meinen die Standardisierung von Metadaten?
Petra Hätscher: Ganz genau. Wenn wir über Forschungsdaten sprechen, reden wir immer über zwei Ebenen: Das eine sind die Messdaten selbst, das andere sind die Metadaten – also die „beschreibenden Daten“. Sie geben uns die Information: Was sind das für Datensätze, wer hat sie erstellt, wann sind sie erstellt worden, in welchem Format werden sie gespeichert und mit welchem Programm kann ich sie öffnen oder wieder auslesen? Nun ist es sinnvoll, diese beschreibenden Daten so weit wie möglich zu standardisieren, also ein einheitliches Format für Metadaten zu schaffen, wie wir es zum Beispiel von bibliografischen Daten (Autorin/Autor, Titel, Verlag, Erscheinungsdatum) kennen. Diese Standardisierung ist eine übergreifende Aufgabe.
Elisabeth Böker: Außerdem gibt es noch Arbeitsgruppen, die sich mit Geschäftsmodellen, Qualitätskriterien, Schulungen und Trainings beschäftigen. Zudem wurde ein Forum zum Austausch von Infrastrukturthemen aufgebaut. Hier zeigte sich ganz besonders, wie wichtig die Erfahrungen der anderen Science Data Center-Mitglieder für das Finden von guten Lösungen sind.
Die Landesinitiative in Baden-Württemberg setzt ihren Schwerpunkt auf Vernetzung. In Ihrem Artikel in der Zeitschrift o-bib schreiben Sie: „Vernetzung ist kein Luxus, sondern eine Notwendigkeit.“
Elisabeth Böker: Wir haben gesehen, dass Forschungsdatenmanagement keine Insellösungen bieten soll. Forschungsdatenmanagement ist ein Teamsport! Wir können deutlich mehr im Forschungsdatenmanagement erreichen, wenn wir standortübergreifend vernetzt zusammenarbeiten, und sparen zugleich auch noch Kosten.
Petra Hätscher: Das kann ich nur unterstreichen. Vernetzung heißt dabei nicht nur Netzwerken im Sinne von sozialen oder fachlichen Netzwerken. Auch Technik muss vernetzt werden, zum Beispiel beim „verteilten Rechnen“:
„Server zu betreiben, auf denen große Datenmengen gerechnet werden können, ist teuer. Es ist daher sinnvoll, diese nicht überall einzeln aufzubauen, sondern sie vernetzt zu nutzen.“
- Petra Hätscher
Elisabeth Böker: Ein von der Deutschen Forschungsgemeinschaft (DFG) angefordertes Expertengutachten zum Aufbau der Nationalen Forschungsdateninfrastruktur hat aktuell herausgearbeitet, wie wichtig die Vernetzung ist. Im Gutachten heißt es: „Voraussetzung einer gelingenden Vernetzung ist die abgestimmte und arbeitsteilige Bearbeitung von Querschnittsthemen.“ Aus den Erfahrungen auf Landesebene würden wir es sehr begrüßen, wenn diese Art von Strukturen auch in der NFDI zum Tragen kommt. Übrigens hat auch schon der Rat für Informationsinfrastrukturen 2016 auf die Notwendigkeit der Vernetzung hingewiesen.
Geben Sie uns ein Beispiel. Wie kann die Vernetzung des Forschungsdatenmanagements in der Praxis gefördert werden?
Elisabeth Böker: Das Portfolio unserer Landesinitiative ist sehr weitreichend, zwei zentrale Bausteine sind – neben den genannten Science Data Centern – zum einen die Weiterentwicklung der zentralen Informationsplattform forschungsdaten.info sowie zum anderen die persönliche Vernetzung der beteiligten Personen über eine Fachkonferenz: Die E-Science-Tage sind eine interdisziplinäre Konferenzreihe, die alle zwei Jahre in Heidelberg – und nun auch online – stattfindet, bei der die FDM-Community zusammenkommt, diskutiert und nach neuen Lösungen sucht. Die E-Science Tage werden kommendes Jahr bereits zum dritten Mal stattfinden – vom 4. bis 6. März 2021 unter dem Motto „Share Your Research Data“ – und haben sich schon zu einer Art Marke entwickelt.
Was verbirgt sich hinter der Plattform forschungsdaten.info?
Elisabeth Böker: forschungsdaten.info etablierte sich als die zentrale Informationsplattform für Forschungsdatenmanagement nicht nur in Deutschland, sondern im gesamten deutschsprachigen Raum. Die Plattform startete in Baden-Württemberg, hat aber inzwischen 17 Partnerinstitutionen, die sagen: Wir bauen keine Insellösungen, sondern bündeln unsere Kompetenzen in einer zentralen Plattform. Die Website führt praxisnah ins Forschungsdatenmanagement ein, gibt Empfehlungen und bietet Best Practice-Beispiele zu allen Fragestellungen, von der Planung des Forschungsdatenmanagements über die Aufbereitung der Daten bis hin zu ethischen Fragen. Insbesondere der Bedarf an rechtlichen Informationen ist sehr hoch. Wir verzeichnen 2020 über 40.000 Besuche auf der Website und sehen nochmals einen enormen Anstieg in jüngster Zeit.
Partnerinstitutionen der Informationsplattform forschungsdaten.info
Die Informationsplattform wird von der Universität Konstanz aus koordiniert. Warum Konstanz?
Petra Hätscher: Wir haben in Konstanz eine über zehnjährige Erfahrung mit der Plattform open-access.net, die bis heute zentrale Informationsplattform zu Open Access, die von der Universität Konstanz gemeinsam mit der Freien Universität Berlin und den Universitäten Göttingen und Bielefeld aufgebaut wurde. Unsere Erfahrungen mit dieser Plattform haben das Bewusstsein gestärkt, dass nicht nur „harte Technik“, sondern auch die sogenannten „weichen Faktoren“ wie Beratung, Schulung und Information eine große Bedeutung haben, um das Thema voranzutreiben. Darauf haben wir aufgebaut und gesagt: Es ergibt viel Sinn, hier am Standort Konstanz nach ähnlichem Muster eine Plattform aufzubauen, die das Thema Forschungsdatenmanagement so platziert, dass es bundesweit von Nutzen ist.
Welchen Einfluss hat das Forschungsdatenmanagement auf Studium und Lehre?
Petra Hätscher: Studierende müssen sich heute viel qualifizierter als noch vor zehn Jahren mit dem Thema „Wie gehe ich mit Daten um?“ beschäftigen. Das spiegelt sich auch in der universitären Lehre wider. Das studienbegleitende Programm „Advanced Data and Information Literacy Track“ (ADILT) an der Universität Konstanz folgt dem Gedanken, dass Forschungsdaten über alle Fächer hinweg immer mehr an Bedeutung gewinnen, und vermittelt Daten- und Informationskompetenzen für alle Studierende. Der ADILT, den die Universität im Rahmen der Exzellenzstrategie des Bundes und der Länder initiiert hat, passt sehr gut zu den Aktivitäten unserer Landesinitiative im Forschungsdatenmanagement. Aus dem Projekt bw2FDM heraus wurde auch ein Kurs zum Forschungsdatenmanagement für Studierende und Promovierende im ADILT entwickelt. Da werden die Querverbindungen sichtbar.
Petra Hätscher ist Direktorin des Kommunikations-, Informations-, Medienzentrums (KIM) der Universität Konstanz.
Dr. Elisabeth Böker ist Mitglied des Teams Open Science an der Universität Konstanz. Sie ist zugleich Koordinatorin des Landesprojekts bw2FDM in Baden-Württemberg sowie Chefredakteurin des Informationsportals forschungsdaten.info.
Zum Weiterlesen: Wie Vernetzung im Forschungsdatenmanagement in der Praxis geleistet werden kann, schildert ein aktueller Artikel im Bibliotheksjournal o-bib anhand der Landesinitiative Baden-Württembergs.