Digitale Forschungsdaten sind ein ergiebiges Thema, betrachtet man beispielsweise die über 400 Hochschuleinrichtungen und davon über 100 Universitäten in Deutschland. Ihr wissenschaftlicher Alltag wird nicht zuletzt durch die Forschung bestimmt. Interessant wird es insbesondere dann, wenn durch Drittmittelgeber, wie beispielweise die Deutsche Forschungsgemeinschaft, Empfehlungen zum Umgang mit digitalen Forschungsdaten vorliegen.Fn01 Um Forschungsprozesse nachvollziehbar und transparent und die Forschungsdaten für die Nachnutzung verfügbar zu machen, müssen zuvor Prozesse der Speicherung, Aufbereitung und Bereitstellung abgestimmt und unterstützt werden. Die entsprechende organisatorische und technische Infrastruktur ist stark durch die Wissenschaftsdisziplinen selbst und ihre Fachcommunities geprägt. Sie lässt sich in diesem Sinne als sehr heterogen beschreiben. Multidisziplinäre Hochschuleinrichtungen stehen dennoch vor der Herausforderung, für das Management digitaler Forschungsdaten einen disziplinübergreifenden Ansatz zu finden. Dieser sollte zumindest grundlegende Verantwortlichkeiten für die beteiligten Hochschuleinrichtungen und deren Unterstützung für die Wissenschaftlerinnen und Wissenschaftler umreißen. Ob und wie sich darüber hinaus generalisierende Ansätze beispielsweise durch ein gemeinsames Daten-Repositorium für verschiedene Typen und Formate von digitalen Forschungsdaten durchsetzen Fn02, sind bislang ebenso offene Fragen, wie die der Zusammenarbeit von Bibliotheken, Rechenzentren, Forschungsabteilungen und den Instituten selbst. Ein Leitfaden mit konkretem Bezug zu strategischen, administrativen und operativen Managementaspekten im Umgang mit den digitalen Forschungsdaten wäre wünschenswert. Ebenso hilfreich wäre es Ansätze kennenzulernen, wie die erforderlichen organisatorischen, technischen und personellen Ressourcen adäquat eingesetzt werden können. Einem Managementkonzept müsste zudem eine umfassende Analyse des Status quo in den einzelnen Hochschuleinrichtungen vorangehen. Hier ist der Austausch von Erfahrungswerten mit den KollegInnen ähnlicher multidisziplinärer Einrichtungen sicher von großem Wert. Fn03
Das "Handbuch Forschungsdatenmanagement" entstand im vergangenen Jahr 2011 an der Fachhochschule Potsdam und könnte in diese Lücke vorstoßen. Insgesamt ist die Publikation ein sehr verdienstvolles Projekt und für die Informationswissenschaft und -praxis ist es wichtig, dass mit dieser breit angelegten Zusammenstellung gewissermaßen ein erster Meilenstein genommen wurde. Alle Autorinnen und Autoren der 17 Beiträge sind in diesem Umfeld bekannte Akteure, die sich bereits in verschiedenen Initiativen und Netzwerken zu Themen wie der digitalen Langzeitarchivierung, dem elektronischen Publizieren und im Umfeld von Open Access aus den Perspektiven der Informationswissenschaft, der Informationsinfrastruktur, aber auch aus disziplinärer Perspektive engagieren. Das Vorwort zum Handbuch stammt von Stefan Winkler-Nees, der bei der Deutschen Forschungsgemeinschaft das Thema Forschungsdaten betreut und damit den Stellenwert dieser Publikation verdeutlicht.
Das Inhaltsverzeichnis selbst lässt eine überzeugende Systematik allerdings vermissen. Mir wird ein Sammelsurium an thematischen Ausschnitten geboten, die in keinem offensichtlichen engeren Zusammenhang durch eine Gruppierung oder Ähnliches dargestellt werden. Sie sind zwar durch Unterkapitelnummern dreier Hauptkapitel nummeriert, jedoch sind diese nicht im Inhaltsverzeichnis zu finden, sondern erschließen sich den LeserInnen nur durch aufmerksames Lesen der Einführung.
Die Herausgeber Stephan Büttner, Hans-Christoph Hobohm und Lars Müller greifen mit dem "Forschungsdatenmanagement" ein Thema auf, das derzeit im bibliotheks- und informationswissenschaftlichen Diskurs ähnlich populär ist wie etwa "die Zukunft der Informationsinfrastruktur", "e-Science" und "e-Research", "Forschungsinfrastrukturen" oder auch "virtuelle Forschungsumgebungen". Es handelt sich also um einen Pfeiler, von dem man sich erhofft, dass er in Zukunft das (wissenschaftliche) Bibliothekswesen als Infrastrukturanbieter trägt. Den gemeinsamen Kern der genannten Entwicklungen bilden verteilte Daten- und Speicherressourcen und Informations- und Kommunikationstechnologien, die kollaboratives Arbeiten an digitalen Daten ermöglichen. Diesen Begleitumständen widmet sich die Publikation gleich in dem der Einführung folgenden Kapitel zum "Research Data Management" und speziell im ersten Unterkapitel "Forschungsdatenmanagement: Infrastruktur für eScience". Leider fällt in dem Kapitel eher eine Anhäufung der im derzeitigen Diskurs gebräuchlichen Schlagworte auf, als dass den LeserInnen Definitionsansätze und die Unterschiede der Begrifflichkeiten vermittelt werden. Ein Glossar wäre insgesamt sehr hilfreich und würde dem Anspruch eines Handbuches gerecht werden. Deutlich wird diese Problem vielleicht auch daran, dass die Herausgeber selbst ihr einleitendes Kapitel mit "Research Data Management" betiteln ohne den Sprachensprung selbst zu thematisieren. Hier offenbart sich ein Desiderat: Es erfolgt auch keine Definition des Begriffes "Forschungsdatenmanagement" durch die Herausgeber. Es handelt sich dabei nicht um einen bereits etablierten Begriff. Ein verbindlicher Status Quo des Forschungsdatenmanagements lässt sich - sieht man von einigen Disziplinen ab, die seit vielen Jahren Strukturen im Umgang mit digitalen Forschungsdaten etabliert haben - nur schwer formulieren. Folgerichtig muss jede aktuelle Bearbeitung des Themas als ein sehr ambitioniertes Unterfangen gelten. Ein Handbuch zum Forschungsdatenmanagement zum jetzigen Zeitpunkt herauszugeben scheint so notwendig wie kaum erschöpfend zu leisten. Gerade wenn man sich aber einer solchen Aufgabe annimmt, ist der Versuch einer umfassenden Darstellung des Konzepts im Sinne einer Arbeitsdefinition ein Muss. Alle darauffolgenden Kapitel hätten auf diese Arbeitsdefinition referenzieren können und ggf. auch das Konzept anhand erweiterter Fragestellungen diskutieren können.
Schade ist auch, dass der von Gregory Crane geprägte Begriff der "eResearch" keine Erwähnung findet, erweitert er doch das stark naturwissenschaftlich geprägte Konzept der eScience (abgeleitet von engl. "sciences" für die Naturwissenschaften") um die geistes- und sozialwissenschaftlichen Disziplinen. Andererseits spiegelt diese Vorgehensweise auch das derzeitig noch nicht systematisierte und dynamische Forschungsfeld wieder. Das einleitende Kapitel hat es damit vielleicht per se schwer, präzise zu werden. Ein Beispiel ist die Erwähnung virtueller Forschungsumgebungen (S. 21-22), die in keiner Weise näher bestimmt werden oder entsprechende Literatur angeboten wird. Dabei sind es gerade Werkzeuge und Services zur Generierung und Bearbeitung von Forschungsdaten auf Grundlage einer bestimmten wissenschaftlichen Fragestellung, die deren Eigenschaften beispielsweise durch Formate und Aggregationsstufen bestimmen. Die Bedeutung der Werkzeuge scheint hierbei ebenso unterschätzt worden zu sein wie ihre Rolle im Forschungsdatenmanagement.
Eine systematische Annäherung an einen Teilaspekt des Forschungsdatenmanagements, die Archivierung von Forschungsdaten, bieten Erich Weichselgartner, Armin Günther und Ina Dehnard. Dieses Kapitel ist allerdings das vorletzte (3.4.) im Handbuch und steht in keiner offensichtlichen Beziehung zum einleitenden Kapitel. Eine Bezugnahme der einzelnen Kapitel untereinander fehlt leider der Publikation insgesamt. Herausgehoben empfehlenswert ist der Abschnitt "Was sind Forschungsdaten", der in Kürze eine Problematik diskutiert, die einen eigenen Sammelband füllen könnte, betrachtete man das Konzept der Forschungsdaten aus disziplinären Perspektiven und vor verschiedenen wissenschaftstheoretischen Hintergründen. Dem Abschluss dieses Unterkapitels
"Der Bereich des Forschungsdatenmanagements zeigt aber, dass auch hier (dank der enormen informationstechnischen Entwicklung) unter anderen, nicht technischen Aspekten neue informationswissenschaftliche Arbeitsfelder entstanden sind." (S. 17)
fehlt an dieser Stelle die Konkretisierung durch entsprechende Beispiele. Eine Referenz auf das Kapitel "3.5 Informationswissenschaftler im Forschungsdatenmanagement" hätte dem beispielsweise Abhilfe getan. Dem Kapitel "Research Data Management" folgt eine kompakte Darstellung durch Stefanie Rümpel zum Lebenszyklus von Forschungsdaten und den beiden wesentlichen Modellen des "CurationLifecycle Model" des britischen Data Curation Center (DCC) und des "Data Management andCurationContinuum". Der anschließende Artikel "Datenmanagement und Data Sharing: - Erfahrungen in den Sozial- und Wirtschaftswissenschaften" (Denis Huschka, Claudia Oellers, Notburga Ott, Gert G. Wagner) gehört laut Einführung zum ersten Teil des Handbuchs. Warum dieser dort zugeordnet und aufgrund seines deutlichen Bezugs zu einer bestimmten Disziplin nicht passender dem zweiten Teil zur Praxis des Forschungsdatenmanagements zugeordnet wird, erschließt sich nicht.
Der zweite Teil des Bandes berücksichtigt Einzelaspekte aus der Praxis des Forschungsdatenmanagements. Roland Bertelmann und Heinz Pampel bieten einen Überblick zu "Data Policies" durch Forschungsförderer und -einrichtungen. Gerald Spindler und Tobias Hillegeist legen rechtliche Probleme der elektronischen Langzeitarchivierung von Forschungsdaten dar. Ein weiterer für die Praxis entscheidender Aspekt wären Lizenzmodelle für die Publikation digitaler Forschungsdaten, die leider unerwähnt bleiben. Dieses Desiderat benennen die Herausgeber auch selbst. Uwe Jensen beschreibt mit dem Bezug zu sozialwissenschaftlichen Daten die Vorgehensweise beim Erstellen von Datenmanagementplänen. Dieses Kapitel ist für die eingangs angedeuteten Anforderungen für einen Überblick sehr hilfreich und lesenswert. In einem Handbuch zum Forschungsdatenmanagement hätte ich mir eine Reihe mehr derartiger Beiträge oder Beispiele konkreter Datenmanagementpläne gewünscht. Im darauffolgenden Kapitel behandelt ebenfalls Uwe Jensen gemeinsam mit seinen KollegInnen Alexia Katsanidou und Wolfgang Zenk-Möltgen Metadaten und Standards für Forschungsdaten. Trotz des nicht aus der Kapitelüberschrift ersichtlichen Zuschnitts auf sozialwissenschaftliche Daten bietet das Kapitel einen ersten Überblick über die gebräuchlichen disziplinübergreifenden Standards zur Erschließung digitaler Forschungsdaten als ein essentielles Themenfeld des Forschungsdatenmanagements. Da die Formal- und Inhaltserschließung ein klassisches informationswissenschaftliches Thema ist, würde ich eine tiefergehende Untersuchung zu derzeit gebräuchlichen Metadaten- und Dokumentationsstandards und ihren Stärken und Schwächen als Desiderat für eine nächste Auflage des "book in progress" (S. 8) angeben. Eine solche Auseinandersetzung steht auch in engem Zusammenhang mit der Qualitätssicherung digitaler Forschungsdaten, die leider nicht selbst Eingang in die Publikation gefunden hat (wie die Herausgeber ebenfalls selbst anmerken), aber immerhin mehrfach durch Uwe Jensen aufgegriffen wird. Das Kapitel "Forschungsdaten-Repositorien" von Andreas Aschenbrenner und Heike Neuroth hat einen starken technischen Zuschnitt. Im Zusammenspiel der zu diesem Artikel gehörenden letzten beiden Unterkapitel und dem darauffolgenden Kapitel "Langzeitarchivierung" von Jens Klump wird letztlich ein übersichtsartiges Bild der derzeit für technische Lösungen wie Repositorien charakteristischen Anforderungen und vor allem auch der organisatorischen, politischen und rechtlichen Herausforderungen an die Speicherung, Langzeitarchivierung und Bereitstellung digitaler Forschungsdaten gezeichnet. Spätestens bei diesem Kapitel wird allerdings auch deutlich, dass das Handbuch viele Redundanzen beinhaltet. So wird beispielsweise die Definition digitaler Forschungsdaten mehreren Artikeln vorangestellt, ebenso wie mehrfach eine Erläuterung des Data Life Cycle angeboten wird. Matthias Razum widmet sich daran anschließend den Systemen und Systemarchitekturen für das Datenmanagement, wobei er einerseits funktionale Anforderungen an das Datenmanagement formuliert und zum anderen gebräuchliche Architekturen wie Datenbanken, Managementsysteme für digitale Objekte und die Grid-Infrastruktur sowie das Cloud Computing vorstellt. Für eine umfassende Nachnutzung von Forschungsdaten müssen Methoden zu Analyse und Visualisierung der Daten entwickelt werden. Dieses sehr spannende und angesichts der anwachsenden Datenmengen hoch relevante Thema umreißen Bettina Berendt, Joaquin Vanschoren und Bo Gao im Kapitel "Datenanalyse und Visualisierung".
Der dritte Teil beleuchtet schließlich strategisch-konzeptionelle Entwicklungen des Forschungsdatenmanagements. "Data Curation Services", wie sie am ICSU World Data Center forClimate institutionalisiert sind, werden durch Michael Lautenschlager beschrieben. Der Fokus der Data Curation liegt hier auf der Sicherung der Integrität der digitalen Objekte. Sünje Dallmeier-Tiessen formuliert im Anschluss Strategien zur Veröffentlichung digitaler Forschungsdaten, indem sie drei Publikationsmodelle vorstellt. Dieses Kapitel wäre in einem einführenden Teil besser aufgehoben, schließlich ist die Publikation der Forschungsdaten neben der Ermöglichung einer Nachnutzung eine wesentliche Zielstellung für das Forschungsdatenmanagement und klar durch die Forschungsförderer forciert. Günther Neher und Bernd Ritschel widmen sich dann dem zukunftsweisenden Thema der semantischen Anreicherung und Verknüpfung der Forschungsdaten und ihrer Metadaten. Dieses Kapitel bietet eine Einführung, die den Stellenwert des Themas sowie das notwendige Grundlagenwissen umreißt und die Vorgehensweise anhand eines Beispiels aus den Geowissenschaften illustriert. Es entspricht damit einem klassischen Beitrag in einem Handbuch und kann zum Selbststudium und darauf aufbauender weiterer Arbeit sehr empfohlen werden. Das anschließende Kapitel zur Datenarchivierung wurde bereits eingangs erwähnt. Den Abschluss bildet eine Einordnung des Informationswissenschaftlers in das Forschungsdatenmanagement im weitesten Sinne auch aus internationaler Perspektive. Lesenswert ist hierbei insbesondere das Unterkapitel zur Nachfrage nach den für den sog. "Data Librarian" formulierten Kompetenzen. Sie sind zwar im deutschsprachigen Raum gefordert, werden aber kaum unter Begriffen wie "Data Librarian", "Data Curator" oder gar "Data Manager" subsummiert.
In der Gesamtschau besteht der Wert der Publikation insbesondere darin, dass sich die Herausgeber einem wichtigen und für unsere Profession zukunftsweisenden Thema erstmals in dieser Form annahmen. Der Anspruch eines Handbuchs wird aber nur bedingt erfüllt. So liest man z.B. "Das Handbuch Forschungsdatenmanagement ist konzipiert als Leitfaden für das Selbststudium sowie zur Unterstützung der Aus- und Weiterbildung auf dem aktuellen Stand der Diskussion." (S. 7) Dieses Konzept wird aber durch die fehlende Systematisierung nicht umfänglich eingelöst. Vielmehr liegt der Schwerpunkt auf einer Darstellung der Diskussion - und dies deutlich naturwissenschafts-, sozial- und wirtschaftsdatenlastig. Gerade aus der Perspektive des Informationsmanagements an wissenschaftlichen Einrichtungen ist eine weitere Systematisierung der Prozesse und eine beispieluntermauerte Benennung möglicher verantwortlicher Einrichtungen für die Speicherung, Erschließung und Bereitstellung digitaler Forschungsdaten unbedingt sinnvoll und notwendig. Der Umfang des Konzepts Forschungsdatenmanagement wird in diesem Handbuch auch deutlich aufgezeigt. Es erfüllt in diesem Sinne seinen Zweck.
Die Aus- und Weiterbildung der InformationswissenschaftlerInnen und der InformationsspezialistInnen für das Forschungsdatenmanagement spielt an verschiedenen Stellen des Handbuches eine große Rolle. Deutlich wird dies etwa dadurch, dass die Heimathochschule des Potsdamer Herausgeberteams sich selbst dieses Thema auf die Lehragenda gesetzt hat (siehe insbesondere Kapitel 3.5). Ich empfinde dies als deutliches und sehr erfreuliches Zeichen, mit einer solchen Publikation die Rolle von InformationswissenschaftlerInnen und InformationsspezialistInnen in Bibliotheken, Archiven und Dokumentationseinrichtungen zu stärken und insofern eine deutliche Position im fachwissenschaftlichen und wissenschaftspolitischen Diskurs zu beziehen.
Abschließend darf der Hinweis auf die sehr erfreuliche parallele Veröffentlichung der Publikation nach dem Prinzip von Open-Access-Publikation bei Bock+Herchen nicht fehlen, die unter diesem Link zu erreichen ist: http://opus.kobv.de/fhpotsdam/volltexte/2011/241/pdf/HandbuchForschungsdatenmanagement.pdf
Fußnoten
[1] Deutsche Forschungsgemeinschaft(2009) Empfehlungen zur gesicherten Aufbewahrung und Bereitstellung digitaler Forschungsprimärdaten. - URL: http://www.dfg.de/download/pdf/foerderung/programme/lis/ua_inf_empfehlungen_200901.pdf zurück
[2] Vgl. "Open Data LMU" - URL: http://data.ub.uni-muenchen.de/ zurück
[2] Vgl. Scheid, Susanne & Töwe, Matthias (2011) User expectations in archived research data. - URL: http://www.digitalpreservationsummit.de/presentations/toewe.pdf zurück
Maxi Kindling
ist wissenschaftliche Mitarbeitern und promoviert am Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin.