Das Dilemma von Mehrwert und erhöhtem Aufwand
Anreize und Vorteile digitaler Forschungsinfrastrukturen
Interessenverteilung und -gewichtung
Risiken
Ausblick

Das Dilemma von Mehrwert und erhöhtem Aufwand

Digitale Forschungsinfrastrukturen sind derzeit in aller Munde. Einige Länder bzw. länderübergreifende Initiativen haben dazu White Paper, Roadmaps und Empfehlungen zum Umgang mit Forschungsdaten herausgegeben sowie mit deren Umsetzung begonnen. Neben den technologischen Problemen ist damit jedoch ein ganz anderes, nicht zu unterschätzendes Problem verbunden: der Mehraufwand, der sich für die Forschenden ergibt, welche ihre eigenen Daten in die Infrastruktur übertragen möchten. Eine kürzlich durchgeführte, qualitative Studie unter Geschichtswissenschaftlern in der Schweiz ergab in diesem Zusammenhang, dass die Zeit, welche für die Aufarbeitung, Bereinigung, Beschreibung und schliesslich die Überführung von einigen der befragten Historiker gefürchtet wird (Hügi, Schneider, 2013:43ff.). Dies gilt umso mehr, als für die befragten Teilnehmer a priori kein klarer Vorteil bezüglich der Benutzung einer digitalen Forschungsinfrastruktur erkannt werden konnte. Dies drückte sich in der Studie unter anderem durch sehr unterschiedliche Erwartungen und Bedürfnisse aus (siehe User stories, Hügi, Schneider, 2013:52-53). Denn selbst wenn eine Forschungsinfrastruktur so benutzerfreundlich und niederschwellig wie möglich gestaltet ist, führt die Datenaufnahme, die Beschreibung der Daten und die Bereinigung bzw. Anonymisierung der Daten unabwendbar zu einem zusätzlichen Zeitaufwand. Dieser Mehraufwand sollte bei allen Realisierungen in Betracht gezogen werden, da er in jedem Fall eine zu überwindende Hürde für die Forschenden darstellt, die umso grösser erscheint, wenn der damit verbundene Mehrwert nicht bekannt ist. Es müssen folglich entweder ein offensichtlicher Vorteil im Gebrauch einer solchen Infrastruktur erkennbar sein oder aber zusätzliche Ressourcen zur Verfügung gestellt oder letztlich verpflichtende Massnahmen eingeführt werden, die aller Erfahrung nach bei den Betroffenen auf wenig Gegenliebe treffen.

Momentan scheint es aber so, dass einfachheitshalber und wie selbstverständlich davon ausgegangen wird, dass der Mehraufwand auch einen direkten Mehrwert für die Forschenden selbst mit sich bringt und sich die aktive Benutzung von digitalen Forschungsinfrastrukturen quasi von alleine etablieren wird. Dabei sollte nicht vergessen werden, dass der Erfolg einer digitalen Forschungsinfrastruktur davon abhängt, dass sie aktiv benutzt wird. Es kann davon ausgegangen werden, dass ganz nach dem Metcalfeschem Gesetz eine Forschungsinfrastruktur umso nützlicher wird, je mehr Personen sie nutzen. Damit einhergehend muss die aktive Benutzung derart propagiert werden, dass sich für die Wissenschaftler entweder eine intrinsische Motivation durch einen persönlichen Mehrwert ergibt oder eine extrinsische Motivation, durch Belohnung oder Zwang, vorliegt.

Anreize und Vorteile digitaler Forschungsinfrastrukturen

Um herauszufinden, welche dieser beiden Aspekte bezüglich digitaler Forschungsinfrastrukturen vorrangig ist, wurden in der bereits erwähnten Studie die unterschiedlichen Zielsetzungen und erhofften Vorteile von solchen Infrastrukturen aus Dokumenten des aktuellen Diskurses zusammengetragen. Dieses Vorgehen setzt eine Analyse von Christine Borgman fort (siehe Borgman, 2010). Borgman schlug – ausgehend von vier Gründen für den Datenaustausch – eine Kategorisierung basierend auf zwei Achsen vor, welche die Interessen von vier unterschiedlichen Akteuren betreffen: eine Achse beschreibt den Interessenbereich der Datenproduzenten bzw. der Datennachnutzer. Das heisst, dass es Vorteile für diejenigen Forschenden gibt, welche die Daten produzieren und in die Infrastruktur integrieren sollen, und zugleich Vorteile für diejenigen Forschenden, welche ihre eigene Forschung auf der Arbeit anderer aufbauen wollen und die Daten somit nachnutzen. Die zweite Achse betrifft den Interessenbereich der Wissenschaft bzw. der Öffentlichkeit. Das heisst, dass der Vorteil einer digitalen Forschungsinfrastruktur entweder der Öffentlichkeit zugutekommen kann, beispielsweise durch journalistische Tätigkeiten oder bessere Transparenz oder aber im Interesse der Wissenschaft steht, um die Wissenschaft im Allgemeinen voranzutreiben. Borgman beschränkt sich bei ihrer Analyse ausschliesslich auf Gründe für den Datenaustausch. Doch digitale Forschungsinfrastrukturen können auch andere Zwecke erfüllen, die den Datenaustausch nicht zwangsläufig miteinbeziehen, wie beispielsweise die Langzeitarchivierung der Daten.

Weitere Gründe für die Einführung und Benutzung digitaler Forschungsinfrastrukturen wurden (ohne Anspruch auf Vollständigkeit) zusammengetragen und sind im Folgenden kurz beschrieben. Die erwähnten Zwecke und Zielsetzungen stammen von Keller-Marxer (2008:14-15), Neuroth et al. (2007:273), Borgman (2010:7) sowie Ball (2012:2).

Integrität der Forschungsdaten: Der Erhalt der Integrität von Forschungsdaten erlaubt eine Überprüfung der Forschungsergebnisse durch Dritte. Die Veröffentlichung von Forschungsprodukten und eine transparente Informationskultur verhindern Datenfälschungen.
Sekundärnutzung: Die Veröffentlichung von Forschungsdaten und Werkzeugen ermöglicht es, dass sie auch für Dritte von Nutzen sein und Doppelspurigkeiten vermieden werden können.
Langzeitarchivierung: Die Sicherung der Forschungsdaten ermöglicht eine zeitlich unbegrenzte Aufbewahrung.
Zitierbarkeit von Forschungsdaten: Durch das Zuteilen von einheitlichen Metadaten und persistenten Identifikatoren können auch Forschungsdaten und nicht nur Publikationen zitiert werden.
Nachvollziehbarkeit politischer Entscheide: Werden politische Entscheide aufgrund von Forschungsergebnissen und -daten getroffen, sollen diese Unterlagen für nachkommende Generationen zur Verfügung stehen, damit die Entscheide auch zu einem späteren Zeitpunkt noch nachvollziehbar sind.
Wissenschaftsgeschichte: Die Dokumentation der Forschungsprozesse bietet eine weitere Grundlage für die wissenschaftsgeschichtliche Forschung.
Schnellere Produktion von Daten: Anhand schon bestehender Daten können Datensätze extrahiert und mit zur Verfügung gestellten Werkzeugen neue Daten generiert werden.
Interdisziplinäre Zusammenarbeit: Eine bessere Sichtbarkeit der Forschungsdaten erhöht die interdisziplinäre Zusammenarbeit, welche durch geeignete Infrastrukturen unterstützt und vereinfacht werden kann.
Supportarbeiten: Die Wartung und Instandhaltung von Forschungsdaten, aber auch der dazu benötigten Werkzeuge kann durch eine Infrastruktur übernommen werden.
Daten als öffentliches Gut: Insofern Daten dank öffentlichen Mitteln erstellt werden konnten, sollten sie als öffentliches Gut betrachtet werden und der Öffentlichkeit zur Verfügung stehen.
Bessere Forschung: all die oben erwähnten Punkte führen potentiell zu besserer Forschungsqualität. Mit einer Forschungsinfrastruktur können sowohl die Forschungseffizienz als auch der akademische, wirtschaftliche und soziale Einfluss der Forschungsarbeit erhöht werden.

Interessenverteilung und -gewichtung

Die aufgelisteten Zwecke sollen im Folgenden auf die von Borgman vorgeschlagenen Achsen eines kartesischen Koordinatensystems verteilt werden (siehe Abbildung 1). Dabei wurden die vier von Borgman vorgeschlagenen Argumente (Daten als öffentliches Gut [public goods], Sekundärnutzung [ask new questions], bessere Forschung [advance research] und Integrität der Forschungsresultate [reproducibility]) an dem Platz gelassen, den die Autoren ursprünglich selbst für diese Elemente ausgewählt hat. Die Einteilung und Platzierung der jeweiligen Aspekte auf der Graphik geschah intuitiv und nach Gutdünken der Autoren dieses Artikels. Es ist offensichtlich, dass über die genaue Positionierung eines Elements gestritten werden kann und diese auch Grundlage weiterführender Diskussionen sein sollen.

Als erstes fällt dabei auf, dass sich keiner der aufgelisteten Aspekte im Quadrant “Datenproduzenten-Öffentlichkeitsinteresse” befindet. Daraus ist zu folgern, dass unter den identifizierten Elementen kein Argument ist, welches sowohl im Interesse der Datenproduzenten als auch der Öffentlichkeit ist. Die persönliche Motivation, eigene Daten in eine digitale Forschungsinfrastruktur zu überführen, ist folglich eng mit der wissenschaftlichen Tätigkeit des Forschenden verbunden. Dazu gehören laut der obenstehenden Abbildung die Zitierbarkeit von Daten, eine Supportfunktion, bessere Forschung und interdisziplinäre Zusammenarbeit. Dies erstaunt nicht weiter, da die Forschung, die Forschungsfinanzierung, die Bekanntmachung von Forschungsresultaten sowie das Wissenschaftsmanagement insgesamt zu den Haupttätigkeiten von Wissenschaftler gehören.

Abbildung 1: Zielsetzungen von digitalen Forschungsinfrastrukturen (basierend auf Borgman, 2010:8)

Die vier im Quadranten “Datenproduzenten-Öffentlichkeitsinteresse” platzierten Elemente sind dabei nicht alle für sämtliche wissenschaftlichen Disziplinen gleich relevant. So wird in gewissen Gebieten der Geisteswissenschaften nach wie vor mehr Wert auf die Anzahl publizierter Monographien als auf die Anzahl Zitierungen gelegt (Jehne, 2009:59). Die Supportfunktion ihrerseits ist vor allem für diejenigen Forschungsprojekte von Bedeutung, welche ein Werkzeug wie beispielsweise eine Datenbank entwickeln. Bei einem solchen Forschungsresultat ist es von besonderem Interesse für die Forschenden, dass das Werkzeug instand gehalten und aktualisiert wird. Für Projekte ohne ein solches Forschungsresultat ist dieses Element weniger relevant. Des Weiteren sollten alle Akteure im Zusammenhang mit wissenschaftlicher Forschung an besserer Forschung interessiert sein. Doch erfordert eine bessere Forschung nahezu ausnahmslos auch mehr Aufwand. Das letzte Argument in diesem Quadranten betrifft die interdisziplinäre Zusammenarbeit. Indem die eigene Forschungsarbeit durch die digitale Forschungsinfrastruktur bekannter gemacht wird, können sich dadurch neue (interdisziplinäre) Forschungsprojekte ergeben. Doch dieser Aspekt kann nicht garantiert werden und kann erst eintreten, nachdem der Aufwand geleistet wurde und die Daten in der Forschungsinfrastruktur sind.

Zusätzlich dazu sticht bei der Abbildung hervor, dass sich doppelt so viele Elemente in den Quadranten auf der Seite der Datennachnutzer befinden als auf der Seite der Datenproduzenten. Dies bedeutet, dass digitale Forschungsinfrastrukturen für Datennachnutzer mehr Vorteile bringen, als für die Datenproduzenten. Das deutet auf ein gewisses Ungleichgewicht hin. Idealerweise wäre es aber gerade umgekehrt, denn der zu leistende Aufwand liegt auf der Seite der Datenproduzenten. Doch um diesen Mehraufwand zu rechtfertigen, gibt es nicht sehr viele Anreize. Die meisten Argumente diesbezüglich betreffen eine spätere Nutzung durch Dritte. Dies wiederum heisst, dass – sofern keines der Argumente auf der Seite der Datenproduzenten überzeugt – Forschende altruistisch motiviert sein müssen oder aber ein gewisser “Zwang” oder zumindest eine Notwendigkeit existieren muss, um die Daten in eine Infrastruktur zu überführen.

Risiken

Wie genau ein solcher Zwang aussehen soll, ist eine noch völlig offene Frage. Forschungsfördernde Institutionen können von den durch sie finanzierten Projekten verlangen, dass die Daten in eine digitale Forschungsinfrastruktur integriert werden. Sie können dies zusätzlich dadurch unterstützen, dass für diese Funktion explizit Geld zur Verfügung gestellt wird. Die Forschungsinfrastruktur selbst kann Unterstützung anbieten und versuchen, den Forschenden so viel Arbeit wie möglich abzunehmen. Dies ist aber nur begrenzt möglich, da nur die Wissenschaftler selbst möglichst genaue Metadaten und Kontextinformationen über ihre eigenen Daten beisteuern können. Es kann auch sein, dass im Laufe der Jahre ein gewisser Zwang durch eine soziale Konvention entsteht und beispielsweise Peer-Review-Journals vermehrt darauf bestehen, dass die Daten mit dem Artikel mitpubliziert werden.

Eine im Rahmen der erwähnten Studie durchgeführte Risikoanalyse bezüglich der Einführung einer Forschungsinfrastruktur für die Geisteswissenschaften in der Schweiz (Hügi, Schneider, 2013:58) ergab, dass vier der neun identifizierten Risiken in Zusammenhang mit dem Mehraufwand und dem wahrgenommenen Nutzen stehen. Diese Risiken können zwar nicht zum Scheitern einer solchen Infrastruktur führen, dennoch aber zu einer eventuellen schwachen Nutzung. Die diesbezüglichen Risiken sollen im Folgenden kurz vorgestellt werden:

Risiko 1: Die Schnittstelle der digitalen Forschungsinfrastruktur ist zu kompliziert zu benutzen und erzeugt dadurch einen Mehraufwand.

Benutzerunfreundliche Interfaces können eine Hürde bei der Benutzung von digitalen Infrastrukturen darstellen. Dies kann beispielsweise darin begründet sein, dass vorhandene Datensätze nicht gefunden werden können, die Datenübergabe in die Infrastruktur zu umständlich und zeitaufwändig gestaltet ist oder allgemein die Vertrauenswürdigkeit der dahinter steckenden Infrastruktur in Frage gestellt wird. Im schlimmsten Fall kann eine schlechte Schnittstelle dazu führen, dass Forschende die Infrastruktur nicht mehr oder überhaupt nicht benutzen.

Risiko 2: Die Forschenden werden für das Verwalten von Daten nicht bezahlt.

Die Benutzung und Bereitstellung von Forschungsdaten bzw. -produkten führt zwangsläufig zu einem Mehraufwand. Da die Forschenden für diesen Mehraufwand nicht bezahlt werden, können sie sich weigern, diese Arbeitszeit auf sich zu nehmen. Alternativ dazu müsste dieser Aufwand bei der Beantragung von Forschungsprojekten und im Dauerbetrieb einer jeden Forschungseinrichtung berücksichtigt werden. Damit Forschende bereit sind, diesen Mehraufwand notfalls auf eigene Kosten zu betreiben, müssen sie darin einen klaren persönlichen Mehrwert erkennen können.

Risiko 3: Der Mehraufwand wird im Vergleich zum Nutzen als nicht verhältnismässig angesehen.

Besteht der Anreiz für die Übergabe eigener Forschungsprodukte in eine Forschungsinfrastruktur darin, die Sichtbarkeit der Forschungstätigkeiten der Forschenden zu erhöhen, kann die Nichterfüllung dieses Anreizes die Abwendung von der Infrastruktur bedeuten. Es ist durchaus möglich, dass bereitgestellte Forschungsprodukte nicht von anderen Forschenden benutzt oder zitiert werden. Sollte dies vermehrt der Fall sein, kann das zur Einstellung führen, dass sich der Mehraufwand der Aufbereitung der Forschungsprodukte für die Veröffentlichung nicht lohnt. Infolgedessen können Forschende, welche ihre Forschungsprodukte einmal zur Verfügung gestellt haben, dies danach nicht mehr tun.

Risiko 4: Der persönliche Mehrwert für die Bereitstellung eigener Forschungsprodukte wird nicht wahrgenommen.

Es gibt eher wenige Argumente, welche Forschende in den Geisteswissenschaften für die Benutzung einer Infrastruktur motivieren können. Die intrinsische Motivation, Forschungsprodukte anderen zur Verfügung zu stellen, muss durch einen konkreten Anreiz geschaffen werden. Fehlt dieser klar formulierte Anreiz, können einige Forschende nicht bereit sein, den nötigen Mehraufwand für die Bereitstellung eigener Forschungsprodukte zu leisten.

Ausblick

Digitale Forschungsinfrastrukturen versprechen viel, doch bringen sie auch einige Hindernisse mit sich, die es zu überwinden gilt. Forschende dazu zu motivieren, ihre Daten in eine Infrastruktur zu integrieren, stellt nur eines dieser Hindernisse dar. Dieser Artikel hat die unterschiedlichen Argumente und Vorteile einer solchen Infrastruktur aufgezeigt und darauf hingewiesen, dass nur sehr wenige dieser Argumente Forschende dazu motivieren können, den geforderten Mehraufwand zu leisten. Wenn diese Argumente auf wenig fruchtbaren Boden fallen, entstehen sehr hohe Risiken, die dazu führen können, dass die hohen Investitionskosten, die in virtuelle Forschungsumgebungen gesetzt werden, sich letztlich nicht amortisieren. Um diesen Risiken zu begegnen, benötigt Forschungsdatenmanagement von daher auch begleitende Massnahmen vor, während und nach der Einführung von Infrastrukturen, die aus einer Mischung von externem Coaching (Change Management) sowie in interner Verantwortung gemeinsam erstellter und verbindlich geltender Regeln (Compliance) für die Nutzung bestehen sollten.

Literaturverzeichnis

BALL, Alexander, 2012. How to License Research Data [Online]. Edinburgh. Digital Curation Center. [Konsultiert am 8. Januar 2013]. DCC How-to Guides. Verfügbar unter: http://www.dcc.ac.uk/webfm_send/332.

BORGMAN, Christine L., 2010. Research Data: Who will share what, with whom, when, and why? Peking: China-North America Library Conference, 2010. [Konsultiert am 8. Januar 2013]. Verfügbar unter: http://works.bepress.com/borgman/238

HÜGI, Jasmin und SCHNEIDER, René, 2013. Digitale Forschungsinfrastrukturen in den Geistes- und Geschichtswissenschaften [Online]. Genf. Haute école de gestion de Genève. [Konsultiert am 2. Juli 2013]. Verfügbar unter: http://doc.rero.ch/record/31535?ln=de

JEHNE, Martin, 2009. Publikationsverhalten in den Geschichtswissenschaften. In: Publikationsverhalten in unterschiedlichen wissenschaftlichen Disziplinen Beiträge zur Beurteilung von Forschungsleistungen [Online]. 2. erw. Aufl. Bonn : Alexander von Humboldt-Stiftung. Diskussionspapiere der Alexander von Humboldt-Stiftung, 12. S. 59–63. [Konsultiert am 30. Dezember 2012]. Verfügbar unter: http://www.humboldt-foundation.de/pls/web/wt_show.text_page?p_text_id=1073898

KELLER-MARXER, Peter, 2008. Konzeptstudie zur Entwicklung eines Modells für eine zentrale Langzeitarchivierung von digitalen Primär- und Sekundärdaten der Forschung für die Schweiz [Online]. Bern: Ikeep. [Konsultiert am 7. Januar 2013]. Verfügbar unter: http://e-collection.library.ethz.ch/view/eth:1286

NEUROTH, Heike, ASCHENBRENNER, Andreas und LOHMEIER, Felix, 2007. e-Humanities – eine virtuelle Forschungsumgebung für die Geistes-, Kultur- und Sozialwissenschaften. In: Bibliothek Forschung und Praxis. 2007. Vol. 31, n° 3, S. 272–279. http://dx.doi.org/10.1515/BFUP.2007.272

Prof. Dr. René Schneider ist seit 2006 Professor für Informationswissenschaft an der Haute Ecole de Gestion – Genf und beschäftigt sich dort neben der Lehre schwerpunktmässig mit Fragen der Mensch-Maschine-Kommunikation. Er koordiniert mehrere Projekte zur Schaffung innovativer Benutzerschnittstellen sowie zur Evaluation der Benutzerfreundlichkeit digitaler Bibliotheken und der Nützlichkeit der darin bereitgestellten digitalen Inhalte.

Jasmin Hügi ist Lehr- und Forschungsassistentin an der Haute Ecole de Gestion – Genf.

Motivationen für die Nutzung einer digitalen Forschungsinfrastruktur