> > > LIBREAS. Library Ideas # 14

Download PDF @ edoc HU Berlin
urn:nbn:de:kobv:11-10097066

Bericht über den Workshop „Offener Zugang zu Daten – eine Herausforderung“ im Rahmen der Open-Access-Tage 2008 am 10.10.2008 in Berlin[Fn1]


Zitiervorschlag
Heinz Pampel, "Bericht über den Workshop „Offener Zugang zu Daten – eine Herausforderung“ im Rahmen der Open-Access-Tage 2008 am 10.10.2008 in Berlin[Fn1]". LIBREAS. Library Ideas, 14 ().


Inhalt und Diskussion

Der Workshop „Offener Zugang zu Daten – eine Herausforderung“[Fn2] begann mit einem Impulsvortrag „Offener Zugang zu Forschungsdaten - eine Herausforderung“ von Dr. Hans Pfeiffenberger.[Fn3] In diesem beschrieb der Referent, ausgehend von der finanziellen Dimension, die Relevanz des Themas: Die Erhebung von Forschungsdaten sei häufig sehr kostenintensiv. Am Beispiel der Geowissenschaften nannte er neben den Personalkosten die Unterhaltung von Großgeräten als einen signifikanten Kostenfaktor. Im Rahmen einer „guten wissenschaftlichen Praxis“ [Fn4]stehe neben der Verantwortung gegenüber dem Steuerzahler die Effektivität der Forschung im Zentrum. Forschungsdaten nachnutzbar zu machen, sei eine gesellschaftliche Verantwortung der Wissenschaft. Dank einer offenen Zugänglichkeit der Forschungsdaten werde der Fortschritt der Wissenschaft begünstigt, da, neben der Nachprüfbarkeit der publizierten Ergebnisse, die Forschung auf Basis bereits veröffentlichter Daten ermöglicht werde.

Weiter machte Pfeiffenberger deutlich, dass sich der Wissenschaft mit dem Fortschritt der Informations- und Kommunikationstechnologie neue Möglichkeiten eröffnet haben, die im angloamerikanischen Raum mit den Stichwörtern E-Science und Cyberinfrastructure beschrieben werden. Die stetig steigende Menge an Forschungsdaten und die in vielen Disziplinen bereits etablierte kollaborative Forschung fordern neue Strukturen – organisatorischer und technischer Art – im Umgang mit den Forschungsdaten.
Diese Notwendigkeit, so Pfeiffenberger, zeige sich auch in der wissenschaftspolitischen Diskussion. Die im Juni 2008 von den European Heads Of Research Councils (EUROHORCs) und der European Science Foundation (ESF) veröffentlichte Vision des europäischen Forschungsraums „The EUROHORCs and ESF Vision on a Globally Competitive ERA and their Road Map for Actions to Help Build it“[
Fn5] und die im selben Monat verabschiedete Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen widmen sich dem Umgang mit Forschungsdaten. Während in der EUROHORCs/ ESF-Vision Open Access zu Forschungsdaten gefordert werde – „Open access to the output of publicly funded research and permanent access to primary quality assured research data“ – formulieren die deutschen Wissenschaftsorganisationen einen „dringenden Handlungsbedarf hinsichtlich der systematischen Sicherung, Archivierung und Bereitstellung dieser Daten für die Nachnutzung durch Dritte.“[Fn6]

Anhand des Internationalen Polarjahres 2007-2008[Fn7] und anderer Aktivitäten in den Geowissenschaften machte Pfeiffenberger anschließend auf die praktischen Herausforderungen des Managements von Forschungsdaten aufmerksam. Dabei beschrieb er unter anderem die Notwendigkeit von Richtlinien, Repositorien, qualifizierten Akteuren, Strategien der Langzeitarchivierung und disziplinspezifischen Lösungsansätzen.
Zum Schluss stellte der Referent die Open-Access-Zeitschrift Earth System Science Data (ESSD) vor, deren Herausgeber er ist. Diese widme sich der Beschreibung von frei zugänglichen Forschungsdaten. Dabei, so Pfeiffenberger, werde im Rahmen eines Peer Review die Begutachtung der Forschungsdaten sowie die Zitierbarkeit der Daten gewährt. Dank dieser Strategie werden entscheidende Anreize zur frei zugänglichen Veröffentlichung von Forschungsdaten geschaffen.

Anschließend widmete sich Dr. Jens Klump den Voraussetzungen des Open Access zu Forschungsdaten. Dabei benannte er sechs Aspekte, die den systematischen Umgang – im Rahmen von Open Access – mit Forschungsdaten aus Sicht der aktuellen Diskussion bestimmten: „Vertrauenswürdige Daten (Qualitätssicherung), Langzeitverfügbarkeit der Daten (Archive), Nachweis des Bestands (Kataloge), stabile Links (persistente Identifikatoren), klare Regeln für die Nutzung (Lizenzen), organisatorischer Rahmen (Workflows).“[Fn8] Diese Aspekte wurden mit den rund 40 Teilnehmerinnen und Teilnehmern des Workshops diskutiert. Dabei wurden die unterschiedlichen Herangehensweisen der Teilnehmenden an die Problematik deutlich. Je nach fachlichem Hintergrund der Teilnehmerinnen und Teilnehmer standen verschiedene Vorstellungen von Forschungsdaten im Raum, was sich zum Beispiel in der Verwendung unterschiedlicher Terminologien (Primär- und Sekundärdaten; Daten; Forschungsdaten) äußerte.[Fn9]

Diese disziplinspezifischen Perspektiven schlugen sich auch bei der Diskussion um das Kernthema Open Access nieder. Während Pfeiffenberger, aufgrund seiner positiven Erfahrungen in den Geowissenschaften, zu offen zugänglichen Forschungsdaten warb, äußerten sich andere Teilnehmerinnen und Teilnehmer, mit Blick auf disziplinspezifische Herausforderungen, skeptisch. Konsens herrschte darüber, dass Forschungsdaten, welche Grundlage einer wissenschaftlichen Publikation sind, frei zugänglich sein sollten. Eine Forderung, die auch von naturwissenschaftlichen Verlagen, im Rahmen der „Brüssel Declaration“, mitgetragen wird.

In der Diskussion zum Themenfeld „Vertrauenswürdige Daten (Qualitätssicherung)“ stand die Frage nach Kriterien zur Qualitätssicherung im Mittelpunkt. Klump machte deutlich, dass die Nachnutzung eine hohe Qualität der Forschungsdaten voraussetze. Hier, so das Fazit aus der Diskussion, sind Erhebende und Nachnutzende gefordert, sich auf disziplinspezifische Kriterien der Qualitätssicherung festzulegen. Bei der„Langzeitverfügbarkeit der Daten (Archive)“ scheint sich ein disziplinübergreifendes Vorgehen zu bewähren. Klump wies auf die Empfehlung Nr. 7 zur Sicherung guter wissenschaftlicher Praxis hin, welche in Deutschland Standard sei:

„Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, für zehn Jahre aufbewahrt werden.“[Fn10]

In diesem Kontext machte Klump auf die völlig unterschiedlichen Auffassungen des Begriffes „Langzeit“ aufmerksam. Während Bibliotheken, Archive und Museen (je nach Sammelauftrag) mehrheitlich die Dauerhaftigkeit des Begriffs über viele Jahrhunderte hinweg betonen, werde in der Informatik unter Langzeit ein deutlich kürzerer Zeitraum verstanden. In der wissenschaftlichen Praxis verkürze sich die Verfügbarkeit der jeweiligen Forschungsdaten häufig auf den jeweiligen Projektzeitraum. Eine mögliche Lösung, Forschungsdaten systematisch zu managen, sei in der Gestaltung des „organisatorischen Rahmens (Workflows)“ zu finden. Klump beschrieb das an der Monash University entwickelte Modell des Data Curation Continuum[Fn11]. Dieses beschreibe, gegliedert in drei Stationen (Privat Research Domain, Shared Research Domain, Public Domain) den Weg digitaler Objekte aus der geschlossenen Arbeitsplattform der Wissenschaftlerin oder des Wissenschaftlers in das frei zugängliche Repositorium der jeweiligen Institution. Das Modell stieß unter den Anwesenden auf Interesse. In Fragen und Kommentaren wurden insbesondere die Anforderungen an die einzelnen Schnittstellen zwischen den Stationen deutlich, in welchen Migrationen stattfinden. Dabei wurde deutlich, dass diese Schnittstellen neben einer technischen auch eine organisatorische Dimension haben. Mehreren Teilnehmerinnen und Teilnehmer wiesen in diesem Kontext auf fehlende Konzepte und Werkzeuge hin.

Sobald Forschungsdaten nachnutzbar sind, ergibt sich das Problem „stabiler Links (persistente Identifikatoren)“. Klump berichtete über die Erfahrungen des von der DFG geförderten Projekts zur Publikation und Zitierfähigkeit wissenschaftlicher Primärdaten (STD-DOI). In diesem sei die Adressierung von Forschungsdaten mit persistenten Identifikatoren erfolgreich erprobt worden. Einhergehend mit der stabilen Identifikation der Forschungsdaten gelten die von Pfeiffenberger im Rahmen der Zeitschrift Earth System Science Data gemachten Erfahrungen zur Zitation der Forschungsdaten als entscheidender Anreiz. Aufbauend auf der Voraussetzung der persistenten Adressierung gelte es, so Klump, den „Nachweis des Bestands (Kataloge)“ zu garantieren. Die Diskussion zu diesem Thema berührte die Anforderungen an Metadaten und die dafür in vielen Disziplinen schon etablierten Standards sowie die Weiterentwicklung von Suchtechnologien. Klump nahm hier die Sichtweise des praktizierenden Wissenschaftlers ein und forderte zentrale Zugänge.

Weiterhin müssen nach Klumps Ansicht „klare Regeln für die Nutzung (Lizenzen)“ von Forschungsdaten formuliert werden. In der Diskussion zu diesem Punkt wurde das Spannungsfeld zwischen Open Access, wirtschaftlichen Interessen in einigen Disziplinen (z.B. im Rahmen von Patenten) und soziologischen Aspekten deutlich. Auch hier, so das Fazit der Diskussion, gilt es disziplinspezifische Antworten zu finden.

Fazit

Das starke Interesse der Teilnehmer und Teilnehmerinnen aus Bibliotheken, Rechenzentren und der Wissenschaft zeigte die Aktualität des Themas. Deutlich wurde, dass die im anglo-amerikanischen Raum geführte Diskussion und die bereits entwickelten Konzepte in Deutschland größtenteils unbekannt sind.[Fn12] Die Referenten zeigten, dass der freie Zugang zu Forschungsdaten einen systematischen Umgang mit diesen voraussetzt.
Die Diskussion während des Workshops bewegte sich häufig auf einer sehr abstrakten Ebene. In vielen Disziplinen, so scheint es, fehlen die Erfahrungen mit frei zugänglichen Forschungsdaten. Während allgemein der freie Zugang zu Forschungsdaten gefordert wird, sind es häufig detaillierte disziplinspezifische Herausforderungen, die eine interdisziplinäre Diskussion erschweren. Die von Pfeiffenberger und Klump vorgestellte Strategie der Publikation von Forschungsdaten ähnlich einer traditionellen Text-Publikation scheint aktuell die wohl konsensfähigste Lösung zu sein.

Fußnoten

[Fn 1] Die Open-Access-Tage 2008 fanden vom 9. bis 10.10.2008 auf dem Campus der Freien Universität Berlin statt und wurden in Kooperation mit der Helmholtz-Gemeinschaft und der Max-Planck-Gesellschaft veranstaltet. Die Dokumentation der Veranstaltung ist auf der Informationsplattfom open-access.net unter folgender ULR auffindbar:
http://open-access.net/de/aktivitaeten/openaccesstage/archiv/openaccesstage_2008/#c1680
Ein ausführlicher Tagungsbericht findet sich in: Vock, Rubina: Freier Zugang zu Wissen. Open-Access-Tage 2008. In: H-Soz-u-Kult, 05.12.2008. URL:
http://hsozkult.geschichte.hu-berlin.de/tagungsberichte/id=2400
(zurück)

[Fn 2] Der Workshop „Offener Zugang zu Daten – eine Herausforderung“ wurde von Dr. Jens Klump (Deutsches GeoForschungsZentrum GFZ, http://www.gfz-potsdam.de) und Dr. Hans Pfeiffenberger (Alfred-Wegener-Institut für Polar- und Meeresforschung – AWI, http://www.awi.de) organisiert. Beide sind in Einrichtungen der Helmholtz-Gemeinschaft (http://www.helmholtz.de) tätig und beschäftigen sich seit mehreren Jahren mit den Herausforderungen rund um den Open Access zu Forschungsdaten. Klump ist wissenschaftlicher Mitarbeiter am Daten- und Rechenzentrum des GFZ. Er ist u.a. für die Scientific Drilling Database (SDDB, http://www.icdp-online.org/contenido/lakedb) des GFZ zuständig und in nestor, dem deutsche Kompetenznetzwerk zur digitalen Langzeitarchivierung (http://www.langzeitarchivierung.de), sowie in dem von der Deutschen Forschungsgemeinschaft (DFG, http://www.dfg.de) geförderten Projekt zur Publikation und Zitierfähigkeit wissenschaftlicher Primärdaten (STD-DOI, http://www.std-doi.de) involviert. Pfeiffenberger ist stellvertretender Leiter des Rechenzentrums des AWI. In einer Vielzahl von Projekten beschäftigt er sich u.a mit den Themen Repositorien, Grid-Computing und Informations- und Kommunikationstechnologien für wissenschaftliche Institutionen. Er ist Sprecher des Arbeitskreises Open Access in der Helmholtz-Gemeinschaft (http://oa.helmholtz.de) und in der Arbeitsgruppe Forschungsprimärdaten der Allianz der deutschen Wissenschaftsorganisationen aktiv. Darüber hinaus ist er Herausgeber der Open-Access-Zeitschrift Earth System Science Data (ESSD, http://www.earth-system-science-data.net). (zurück)

[Fn 3] Klump, Jens; Pfeiffenberger, Hans: Offener Zugang zu Forschungsdaten - eine Herausforderung. Open-Access-Tage 2008. Berlin, 2008. URL: http://open-access.net/fileadmin/OAT/
Pfeiffenberger-OAT-2008-10-10.pdf
(zurück)

[Fn 4] Deutsche Forschungsgemeinschaft: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Empfehlungen der Kommission Selbstkontrolle in der Wissenschaft. Weinheim, 1998. URL: http://www.dfg.de/aktuelles_presse/reden_stellungnahmen/download/empfehlung_wiss_praxis_0198.pdf (zurück)

[Fn 5] European Heads Of Research Councils; European Science Foundation (2008): The EUROHORCs and ESF Vision on a Globally Competitive ERA and their Road Map for Actions to Help Build it. URL: http://eurohorcs.drift.senselogic.se/download/
18.45b270a411a9ed8e12780003647/EUROHORCs_ESF_ERA_RoadMap.pdf
(zurück)

[Fn 6]
Allianz der deutschen Wissenschaftsorganisationen: Schwerpunktinitiative Digitale Information der Allianz-Partnerorganisationen. 2008. URL:
http://www.dfg.de/aktuelles_presse/das_neueste/download/pm_allianz_digitale_information_details
_080612.pdf
(zurück)

[Fn 7] http://www.polarjahr.de (zurück)

[Fn 8] Pfeiffenberger, Hans; Klump, Jens: Offener Zugang zu Daten. Open-Access-Tage 2008. Berlin, 2008. URL: http://open-access.net/fileadmin/OAT/Workshop_Daten.pdf (zurück)

[Fn 9] Zur Problematik der Begriffe Primär- und Sekundärdaten siehe: Klump, Jens: Wissenschaftliche Primärdaten. Version 1.5. In: nestor-Handbuch. Eine kleine Enzyklopädie der digitalen Langzeitarchivierung, 2008. URL: http://nestor.sub.uni-goettingen.de/handbuch/artikel/nestor_handbuch_artikel_275.pdf. In Deutschland scheint sich der Begriff Forschungsdaten zu etablieren, der insbesondere die interdisziplinäre Diskussion vereinfacht. (zurück)

[Fn 10] http://www.dfg.de/aktuelles_presse/reden_stellungnahmen/download/empfehlung_wiss_praxis_0198.pdf. (zurück)

[Fn 11] Eine Beschreibung des Modells findet sich in folgenden Publikationen: Treloar, Andrew; Groenewegen, David; Harboe-Ree, Cathrine: The Data Curation Continuum Managing Data Objects in Institutional Repositories. In: D-Lib Magazine 13 (2007) 9/10. DOI:10.1045/september2007-treloar; Treloar, Andrew; Harboe-Ree, Cathrine: Data management and the curation continuum. How the Monash experience is informing repository relationships. VALA2008 14th Biennial Conference. Melbourne, 2008. URL: http://www.valaconf.org.au/vala2008/papers2008/111_Treloar_Final.pdf. (zurück)

[Fn12] Eine umfassende Einführung findet sich z.B. bei Lyon, Liz: Dealing with Data. Roles, Rights, Responsibilities and Relationships. Consultancy Report. 2007. URL: http://www.ukoln.ac.uk/ukoln/staff/e.j.lyon/reports/dealing_with_data_report-final.pdf (zurück)