Zum Inhalt springen
13283031794_f951f6acc2_z
21 Mai 2014

Fehler im System: Open Data und publikationsgetriebene Forschung

Der Blogpost fasst Erkenntnisse aus dem Projekt Data Sharing in Academia zusammen. Eine ausführliche Betrachtung findet sich hier.

Offene Forschungsdaten: Zentraler Aspekt europäischer Forschungspolitik

Anfang des Jahres startete die Europäische Kommission mit Horizon 2020 ihr bislang größtes Forschungsförderungsprogramm. Mit 80 Milliarden Euro werden über die nächsten sieben Jahre in Europa Forschung und Innovation gefördert. Horizon 2020 soll Jobs schaffen, Innovation fördern und den wissenschaftlichen Fortschritt vorantreiben.

Ein wichtiger Stellhebel, um diese Ziele zu erreichen, ist der offene Zugang zu Forschungsdaten, also die Verfügbarkeit und Nachnutzbarkeit von Daten aus Forschungsprojekten. Zwischen 2014 und 2015 erhalten Forschungsprojekte, die am Piloten des Open Research Data Projekts der Kommission teilnehmen, drei Milliarden Euro. Aus der Pilotstudie sollen Erkenntnisse über eine Datenpolitik für künftige EU-Forschungsprogramme gewonnen werden. Den Piloten braucht es gar nicht, um das größte Hindernis für den offenen Zugang zu Forschungsdaten zu finden: Publikationsgetriebene Forschung.

Offene Forschungsdaten: Anspruch und Wirklichkeit

Laut einer Studie von 2011 sehen Forscher im fehlenden Zugang zu Forschungsdaten ein Haupthindernis für den wissenschaftlichen Fortschritt. Allerdings geben in der gleichen Studie fast die Hälfte von ihnen an, dass sie ihre Daten grundsätzlich nicht teilen. Die Dunkelziffer dürfte noch etwas höher sein, denn 30 Prozent gaben auf die Frage keine Antwort. Nur 6 Prozent der Befragten gaben an, ihre Daten verfügbar zu machen. Es besteht also eine Diskrepanz zwischen dem Wunsch der Verfügbarkeit nach Daten und der eigenen Bereitschaft zu teilen. Man kann davon ausgehen, dass der prominente Support für Data Sharing in der akademischen Wissenschaft allein keine Änderung im Verhalten der Forschenden bewirkt.

Man muss dazu erwähnen, dass die Befragung vorrangig unter US-Wissenschaftlern durchgeführt wurde und mittlerweile 3 Jahre alt ist. Ich wage aber zu behaupten, dass sich die Zahlen für Deutschland 2014 nicht wesentlich unterscheiden. (Aber das finden wir raus)

Von Forschungsdaten und Elektroautos: Eine Erklärung für die geringe Bereitschaft zu Teilen

General Motors EV1

General Motors EV1

Der Umgang mit Forschungsdaten lässt sich ganz gut mit der Kaufentscheidung bei einem Elektroauto vergleichen. Klar, ein Elektroauto ist super für die Umwelt und damit für die Allgemeinheit; doch neben kurzer Reichweite und langen Ladezeiten, vor allem teuer. Und so sehen viele das Elektroauto lieber in der Garage des Nachbarn, als sich selbst eines zu kaufen.

Mit Forschungsdaten verhält es sich ähnlich. Es besteht Einigkeit darüber, dass der Zugang zu Forschungsdaten förderlich für den wissenschaftlichen Fortschritt, also gut für die Allgemeinheit, ist. Nur: Ist das, was gut für die Allgemeinheit ist, auch das Nächstliegende für die Forscher selbst? Ähnlich wie die Kauferwägung eines Autofahrers für ein Elektroauto, lassen sich mit dem Gemeinwohlargument nur ein Bruchteil der Wissenschaftler davon überzeugen, ihre Forschungsdaten zu teilen. Die wenigsten sind selbstlos.

Publish or perish: Der Fehler im System

Würde ein Elektroauto weniger als ein Benziner kosten, würden dann mehr Leute Elektroautos fahren? Vermutlich. In der Wissenschaft spielen monetäre Anreize allerdings eine geringere Rolle. Die Währung in der Wissenschaft ist Anerkennung. Und die gibt es für das Veröffentlichen von Artikeln, nicht aber für Daten.

Publish or Perish, Veröffentlichen oder Verschwinden, ist das Mantra und häufig die ultima ratio des wissenschaftlichen Treibens. Um in einer derart geprägten Wissenschaft voranzukommen, um berufen und gebauchpinselt zu werden, zählen Publikationen in hochgerankten Journalen. Mit dem Teilen von Daten gewinnt man keinen Blumentopf. Daher teilen auch Professoren und unbefristete Forscher Daten eher, als der ‘Mittelbau’. Zugespitzt formuliert: Die stecken ja auch nicht mehr in der Knochenmühle.

Für viele Forscher sind Daten der Rohstoff für die nächste Publikation. Deshalb behüten sie ihre Daten wie Dagobert seinen Schatz. Und deshalb teilen sie diese nicht. Das ist nachvollziehbar, aber absurd.

Absurd, weil gerade für die rechenlastige Disziplinen der eigentliche Mehrwert in Daten und Analyseskripte liegt und nicht unbedingt in deren narrativer Veredelung. Absurd, weil durch das publikationsgetriebene Forschen der Eindruck entsteht, Daten und Skripte wären noch kein kreatives Produkt. Jeder, der sich mit Erhebungsdesigns, Datendokumentation, Datenaufbereitung und Code beschäftigt, weiß dass das ganze Prozedere nicht nur ein zeitlicher Aufwand ist, sondern auch ein kreativer.

Weshalb es nachvollziehbar ist, nicht zu teilen

Daten nicht zu teilen ist nachvollziehbar, weil für kaum einen Forscher ein Vorteil daraus erwächst. Wer Daten in einem frühen Stadium der Forschung teilt muss damit rechnen, dass ein Kollege diese nutzt und damit publiziert. Und darüber freut man sich als Datenspender natürlich nicht, wenn man zwei Jahre die Kaiserpinguinpopulation in der Antarktis dokumentiert hat und dann ein anderer damit bei Nature landet. Oder noch schlimmer, wenn die eigene gefeierte Studie über Kaiserpinguine bei Nature falsifiziert wird. Selbst wenn man Daten teilt, nachdem man sie zu Genüge ausgeschöpft hat, bestehen also noch unerwünschte Nebeneffekte.

Andererseits gibt es viele gute Gründe, Daten mit anderen Forscher zu teilen. Die eigene Arbeit kann davon profitieren und Kooperationen können entstehen. Man kann sogar einen eigenen kleinen Beitrag zum wissenschaftlichen Fortschritt leisten. Das ist als Motivation für viele nicht zu unterschätzen. Eine Studie von 2007 weist sogar darauf hin, dass das Teilen von Daten zu einer höheren Zitationsrate führen kann.

Dennoch zeigen die Zahlen zum Datasharing-Verhalten, dass das Gesamtpaket der guten Gründe im Vergleich zu den vernachlässigbaren Effekten auf Anerkennung und Karriere einfach zu gering wiegen.

Daten zu teilen ist gut fürs Karma, aber nicht für die Karriere. Auch das ist absurd.

Sie wollen doch nur geliebt werden

Würden mehr Forscher ihre Daten teilen, wenn sie dafür etwas bekämen? Vermutlich. Und dabei muss sich die Währung nicht ändern. Was fehlt im wissenschaftlichen System ist die formale Anerkennung für Intermediäre, also für Daten. Heute gilt: Wer gut publiziert, wird zitiert. Der Hirschindex steigt und damit die Chancen auf berufliches Weiterkommen. Gute Artikel sind gut für die Karriere. Gute Daten dagegen sind leider noch lange nicht so wichtig, wie sie es sein sollten.

Die Aufbereitung von Datensätzen zur Weiternutzung ist eine Leistung, die sich lohnen muss. Daher müssen Daten zitierbar sein, bei Nutzung zitiert werden und das muss sich positiv auf das wissenschaftliche Standing auswirken. Der erste wichtige Schritt ist dabei die Indexierung von Forschungsdaten durch persistente Identifier, ähnlich wie sich DOIs bei wissenschafltichen Publikationen durchgesetzt haben. Damit einher geht die eindeutige Beschreibung von Daten durch Metadaten. Damit werden Daten einfacher zitierbar, nutzbar und auffindbar. Der wichtigste Schritt ist aber die Anerkennung für das Teilen von Forschungsdaten. Und dieser Schritt ist weniger ein technischer, als ein kultureller.

Es ist weniger eine Frage ob, sondern wie zukünftig Forscher zum stärkeren Austausch ihrer Daten, und damit zur stärkeren Kooperation, bewegt werden können. Dabei ist eine Perspektive, die nahe am Forscher und dem Wissenschaftssystem ist aus meiner Sicht die sinnvollste. Und deswegen gehören neben einer leistungsfähigen Forschungsinfrastruktur und state-of-the-art Forschungspolicies unbedingt auch konkrete Anreize zum Teilen ins Portfolio einer erfolgsversprechenden Wissenschaftspolitik. Dann klappt es noch besser mit dem Fortschritt, der Innovation und den Jobs.

Was gut für die Allgemeinheit ist, muss gut für den Einzelnen sein. Das haben Forschungsdaten und Elektroautos gemeinsam.

Quelle

  • Bild: “Story of the guy who would not share”, Hammerin Man (flickr).

Dieser Beitrag ist Teil der regelmäßig erscheinenden Blogposts der Doktoranden des Alexander von Humboldt Institut für Internet und Gesellschaft. Er spiegelt weder notwendigerweise noch ausschließlich die Meinung des Institutes wieder. Für mehr Informationen zu den Inhalten dieser Beiträge und den assoziierten Forschungsprojekten kontaktieren Sie bitte info@hiig.de.

Dieser Beitrag spiegelt die Meinung der Autorinnen und Autoren und weder notwendigerweise noch ausschließlich die Meinung des Institutes wider. Für mehr Informationen zu den Inhalten dieser Beiträge und den assoziierten Forschungsprojekten kontaktieren Sie bitte info@hiig.de

Benedikt Fecher, Dr.

Assoziierter Forscher & Ehem. Forschungsprogrammleiter: Wissen & Gesellschaft

Auf dem Laufenden bleiben

HIIG-Newsletter-Header

Jetzt anmelden und  die neuesten Blogartikel einmal im Monat per Newsletter erhalten.

Aktuelle HIIG-Aktivitäten entdecken

Forschungsthemen im Fokus

Das HIIG beschäftigt sich mit spannenden Themen. Erfahren Sie mehr über unsere interdisziplinäre Pionierarbeit im öffentlichen Diskurs.

Weitere Artikel

Drei Gruppen von Menschen haben Formen über sich, die zwischen ihnen und in Richtung eines Papiers hin und her reisen. Die Seite ist ein einfaches Rechteck mit geraden Linien, die Daten darstellen. Die Formen, die auf die Seite zusteuern, sind unregelmäßig und verlaufen in gewundenen Bändern.

Beschäftigte durch Daten stärken

Arbeitsplätze werden zunehmend datafiziert. Doch wie können Beschäftigte und Gewerkschaften diese Daten nutzen, um ihre Rechte zu vertreten?

Eine stilisierte Illustration mit einem großen „X“ in einer minimalistischen Schriftart, mit einem trockenen Zweig und verblichenen Blättern auf der einen Seite und einem leuchtend blauen Vogel im Flug auf der anderen Seite. Das Bild symbolisiert einen Übergangsprozess, wobei der Vogel das frühere Twitter-Logo darstellt und das „X“ das Rebranding der Plattform und Änderungen im Regelwerk von X symbolisiert.

Zwei Jahre nach der Übernahme: Vier zentrale Änderungen im Regelwerk von X unter Musk

Der Artikel beschreibt vier zentrale Änderungen im Regelwerk der Plattform X seit Musks Übernahme 2022 und deren Einfluss auf die Moderation von Inhalten.

Das Bild zeigt einen Traktor von oben, der ein Feld bestellt. Eine Seite des Feldes ist grün bewachsen, die andere trocken und erdig. Das soll zeigen, dass nachhaltige KI zwar im Kampf gegen den Klimawandel nützlich sein, selbst aber auch hohe Kosten für die Umwelt verursacht.

Zwischen Vision und Realität: Diskurse über nachhaltige KI in Deutschland

Der Artikel untersucht die Rolle von KI im Klimawandel. In Deutschland wächst die Besorgnis über ihre ökologischen Auswirkungen. Kann KI wirklich helfen?