An der Schwelle zum Vierten Paradigma – Datenmanagement in der Klimaplattform
Lars Müller (FH Potsdam)
ABSTRACT
Wenn vom „Vierten Paradigma" (Jim Gray) die Rede ist, dann wird damit nach Empirie, Theorie und Simulation der Übergang zu einer „Daten getriebenen Wissenschaft" bezeichnet. Dieser Prozess vollzieht sich in Abhängigkeit von institutionellen Bedingungen und Wissenschaftsdisziplinen sehr ungleichmäßig.
Voraussetzung für die „Data-driven-Science" ist ein systematisches Datenmanagement, dass die im Forschungsprozess angefallenen Daten sichert, archiviert und nachnutzbar macht. An der Fachhochschule Potsdam wurde deshalb im Projekt Wibaklidama (Wissensbasiertes Klimadaten-Management) die Praxis des Forschungsdatenmanagements empirisch untersucht, um anhand der Ergebnisse den Wandel zur eScience (enhanced Science) mit zu gestalten. Im Fokus standen dabei Einrichtungen der „Klimaplattform" im Raum Brandenburg-Berlin, die klimaforschungsrelevante Daten erfassen, über sie verfügen oder mit ihnen arbeiten. Mit qualitativen Befragungen und der Durchführung von Workshops wurden die Data-Practices und der Bedarf von Wissenschaftler/inne/n an Forschungsdaten ermittelt.
Institutionalisierte Formen des systematischen Datenmanagements existieren parallel zu kleinteiligen projektbezogenen Lösungen. Als besonders problematisch erweist sich die sorgfältige Erschließung mit Metadaten, die für Nachnutzung von Forschungsdaten unabdingbar, aber in der Praxis nur schwer umzusetzen ist. Eindeutig zeigt sich ein breiter Bedarf an Zugangsmöglichkeiten zu Forschungsdaten. Er reicht vom Wunsch nach mittelbarem Zugriff über Experten über den nach Daten-Repositorien bis hin zu fertig aufbereiteten Formen. Diesem Bedarf stehen allerdings auf der Seite der Datenproduzenten die Furcht vor Wettbewerbsnachteilen entgegen, auf der Seite der Datennutzer die Skepsis gegenüber der Qualität fremder Daten.
Die Ergebnisse des Projekts Wibaklidama sollen der Schaffung einer Daten-Infrastruktur dienen, die dem regionalen Bezug wie auch dem Bedarf der interdisziplinär geprägten Klimaforschung gerecht wird. Zwei zentrale Aufgabenfelder zeichnen sich hierfür ab: auf organisatorischer Ebene die Entwicklung von Data-Policys und auf technischer Ebene die Einführung von Semantic-Web-Technologien zum Datenmanagement und -austausch.
Die Zentrale Stellung der Formulierung von Policys verweist darauf, dass die Schaffung von Infrastruktur zunächst auf die Institutsorganisation sowie die Förderung einer Publikationskultur für Forschungsdaten zielen muss. Die Sensibilisierung für das Thema Datenmanagement muss vorangetrieben werden und die institutionellen Rahmenbedingungen für das Datenmanagement sollten verbessert werden, damit auf dieser Basis die technische Infrastruktur aufsetzen kann. Der Einsatz von Semantic-Web-Technologie trägt dabei der Vielfalt und Ungleichzeitigkeit von Systementwicklungen Rechnung.
Die Herausforderungen werden sein, den Abstand zwischen international vernetzten Institutionen zu regional ausgerichteten Einrichtungen und den zwischen Teildisziplinen zu überbrücken, um Forschungsdatenaustausch und -versorgung für alle Beteiligten nachhaltig zu verbessern.

