Archiv des Autors: Petra Gehring

Retroerfassung, nachträgliche Anreicherung und Publikation von Metadaten. Oder: Wie mein Name in die Bibliotheksmaske kam und der digitale Bibliotheks-Katalog mich heute im www als lesbische Redakteurin „outed“

Petra Gehring

Illustration: Matthias Seifert

Ich bin Wissenschaftlerin, habe aber auch ein politisches Leben. Dieses hat insbesondere in den 1990er Jahren zu allerlei namentlich gezeichneten Texten geführt, die in auf kleine Öffentlichkeiten zugeschnittenen Print-Zeitschriften erschienen sind. Ebenso habe ich mich auch in (grauen und nicht-grauen) Zeitschriftenredaktionen engagiert, in welchen mein Name als Mitwirkende nur irgendwo „innendrin“ genannt worden ist. Wichtig: Wir sprechen von Zeitschriften, die lediglich gedruckt erschienen sind – und von welchen man damals als Autorin nie erwartet hätte, dass sie nachträglich als Volltext digitalisiert werden, um sie dann weltweit als Medium anzubieten. Und wir sprechen von Zeitschriften, die in klassischen Bibliothekskatalogen – wo sie überhaupt angeschafft worden waren – auch nur mit ISSN und Titel erfasst worden sind.

Ich halte fest, dass ich meinen Namen in der Print-Welt jedenfalls nie versteckt habe. Weder bereue ich meine Texte, noch finde ich sie heute schlecht. Alles ist namentlich gezeichnet. Allerdings ist man in den 1990er Jahren auch mit politisch heiklen Texten und insbesondere mit der Nennung als Mitwirkende an Zeitschriften noch recht sorglos umgegangen. In der Welt des gedruckten Vertriebs von Schriften ist der Kreis der Leserinnen und Leser ja einigermaßen abschätzbar. Man schreibt nicht für den Globus, sondern für ein Publikum. Zumeist ein kleiner, jedenfalls vorgebildeter, tendenziell auch solidarischer Kreis. Vielleicht wird auch mal der Staatsschutz das lesen. Naja gut, dachte man damals. Jedenfalls: Im Blatt zu publizieren und vor allem das Engagement in der „Redaktion“ hieß nicht, dass potenziell ALLE – nicht nur Nachbarn, Kollegen, Studierende, Bibliotheksgänger, sondern tatsächlich: weltweit jeder Internet­nutzer – dies mit wenigen Klicks recherchieren können.

Zu meiner Überraschung finde ich nun aber seit einiger Zeit in etlichen deutschen Bibliotheken und damit sowohl in den deutschlandweiten Verbundkatalogen als auch in den Beständen der weltweiten Meta-Suchmaschine „Worldcat“ die Einzelhefte der seinerzeit im Selbstverlag und ausschließlich als Print-Organ (wenngleich mit ISSN) produzierten und vertriebenen Zeitschrift IHRSINN („Radikal­feministische Lesbenzeitschrift“) verzeichnet. Und jenseits der Metadaten, die auch in vor-digitalen Katalogen gestanden hätten bzw. mit denen seinerzeit zu rechnen war, werden zusätzlich nun erstens neben den Bandnummern die Schwerpunkt­themen im Katalog aufgeführt, und zweitens werden nun auch die „Red.“ (Redaktion? Redakteurin?) sowie „Mitarb.“ (Mitarbeiterin?) gleichsam heftscharf namentlich genannt.

Meinen Namen finde ich etwa (siehe Abb.) unter dem Titel GegenGewalt als „Red.“ im Katalog-Treffer für eine IHRSINN-Ausgabe von 1997. Bibliographisch hat das alles seine Richtigkeit. Ich schaue im Print-Exemplar nochmal nach: Tatsächlich listet das Impressum (als „Redaktion“) die Namen von sechs Frauen auf, meiner steht aus alphabetischen Gründen vorn. Freilich steht da weder „Autorin“ noch „Herausgeberin“ (also eine urheberschaftliche Rolle) – sondern nur eine presserechtliche, eben: „Redaktion“. Oder sogar nur „Mitarbeit“. Die Herausgeberin der Zeitschrift war nämlich, damals sehr bewusst beschlossen, lediglich ein Verein: „Ihrsinn e.V.“ (was so auch im Impressum steht). Und die Redaktion wiederum – ja sind das denn sechs Einzelpersonen? Nein, so dachten wir natürlich nicht. Sondern die Redaktion ist ein Kollektiv. Wir sind presserechtlich verantwortlich, aber „geoutet“ sind wir als Redakteurinnen nicht. So dachte man/frau jedenfalls in den 1990er Jahren. Vor allem aber: auf die Erfassung und digitale Publikation aller dieser Feindaten eines Impressums waren wir nicht eingestellt.

Gleichwohl scheint nicht nur inzwischen die vormals „analoge“ Katalogangabe retrodigitalisiert und eben global zugänglich „publiziert“ worden zu sein (das scheint im Rückblick der springende Punkt: die Inhalte von Print-Katalogen waren kein Publikat!). Sondern es hat auch eine Erweiterung der (und zwar nun digital erfassten und digital distribuierten) Metadatenfelder stattgefunden zu haben. Es gibt die Rolle „Redakteurin“. Und diese wird nicht nur ‚still‘ erfasst, sondern das System gibt sie eben auf dem Bildschirm auch aus.

Ich ergänze noch, dass die Bibliothekskataloge (vermutlich aufgrund automatisierter Großschreibung zu Zeilenbeginn) den Titel des fraglichen Heftes falsch abbilden. Das Heft 17/1997 der IHRSINN hieß nämlich nicht GegenGewalt, sondern gegenGewalt – wie man leicht sehen kann, ein durchaus sinnentstellender Fehler. Nun lebe ich in einer glücklichen, gänzlich vorurteilsfreien, toleranten Demokratie. Vermutlich wäre nichts in meinen akademischen Leben – kein Begutachtungsvorgang, kein Ergebnis einer Bewerbung, keine Evaluation, keine Beratungsfrage, keine Einladung irgendwohin, kein Eintrag auf „meinprof.de“ und auch kein Internet-Shitstorm – anders verlaufen, hätte man mich stets als eine aus dem IHRSINN-Redaktionskollektiv identifizieren können. Ich nehme das jetzt jedenfalls mal an.

Was freilich, wenn ich Türkin wäre? Oder Afghanin? Oder einfach nur schüchtern? Oder wenn in einigen Jahren dann doch vielleicht meine Einreise in bestimmte Länder von Computern genehmigt werden wird, die vorher den WorldCatchecken? Einreiseverbote soll es ja schon wegen Witzen auf Twitter gegeben haben.[1] Oder vor allem: Was ist, wenn ich mich nun frage, ob es für eine afghanische Freundin zum Problem werden könnte, mich gut zu kennen?

Datenschutz, übernehmen Sie! Und folgendes sei bitte auch als Schnappschuss aus der Betroffenensicht an die beteiligten Bibliotheksmanager*innen übermittelt: Irgendwann in den 2010er Jahren hat man Redaktionsmitgliedschaften für ein bloß „technisches“ Datum erklärt – Einwilligungen aus den 1990er Jahren aber nicht erfragt und dennoch zum Beispiel Redaktions-Angaben „(Red.)“ im Impressum als ‚irgendwie auch Autorschaft‘ (das heißt, informationstechnisch als „Personen“) zu verbuchen begonnen. Die Netzindustrie will Eigennamen.

Auch bibliographische Angaben verändern aber ihren Sinn, wenn sie aus einem Print-Impressum über die digitale Publikation eines Katalogs ins Internet wandern. Ebenso verändern Namensnennungen ihren Sinn, wenn Kataloge nicht nur (anstatt zum Beispiel allein wissenschaftlicher Bestände) „alle“ (also etwa auch die grauen, politischen oder populären) Publikationen einer Autorin gleichen Namens anzeigen (identifizierbar als natürlichen Person – vgl. den Beitrag zur Autor-Identifikation), sondern man retrospektiv die bibliographische Erfassung erweitert und auch Namen erfasst werden, die gar keine Autoren-Angaben sind. Auch hier ließe sich weiterdenken: Was, wenn die Datenbankerfassung auch noch alle Pseudonyme von Autor:innen verknüpft und bei Abfragen mit ausgibt? Dann würde eine schreib-politische Differenzierung (welche die schriftstellerische Freiheit symbolisiert, aber auch verbürgen soll) daten-politisch unterlaufen. Die (guten) Gründe für ein (zumindest für Fragen der Person und von Persönlichkeitsrechten) sensibles Identitätsmanagement müssen nun den (stärkeren) Gründen für ein Informationsmanagement weichen.

Personenbezogene, datenschutzrechtlich kritisch zu nennenden Daten sind im Falle der vermeintlich unschuldigen Veröffentlichung jener Bibliotheksangabe „Red. …“ doch wohl durchaus im Spiel: Hier geht es konkret um sexuelle Orientierung und zudem um das Thema „Gewalt“. Ob (nur) Autorinnen und Herausgeberinnen oder auch weitere Namen aus dem Impressum „retro“-öffentlich werden: Bibliotheken haben augenscheinlich die Definitionsmacht. Einwilligung? Oder auch nur Information? Betroffene gibt es, so scheint es, nicht. – Was wäre, wenn ich nun noch verriete, dass mein eigener Beitrag im Heft sogar „Gegengewalt“ heißt … ?

http://portal.hebis.de/servlet/Top/frames/hitsframe [7.1.2022]


[1] https://www.zeit.de/digital/internet/2012-01/dhs-verweigert-einreise-wegen-twitter [20.1.2020]

Die Pflicht zur “ID” – warum und für wen eigentlich Autorschafts-Identifizierung?

Das globale Publikations-Rückverfolgbarkeitsinstrument ORCID

Petra Gehring

Ilustration: Matthias Seifert

Vor einigen Jahren erreichte mich erstmals eine PDF-Korrekturfahne, die nicht nur – wie inzwischen leider üblich – den Verlagsvertrag (erst) im letzten Moment zur Kenntnis gab, nämlich als Bestandteil der Korrekturfahne enthielt. Die Fahne forderte vielmehr neben Adresse und elektronischer Erreichbarkeit auch die Eingabe meiner ORCID-Nummer. Es handelte sich um ein Pflichtfeld, versehen mit dem freundlichen Kommentar: Habe man noch keine ORCID-Nummer? Das sei kein Problem, der Verlag werde dann automatisch eine besorgen. Ein Feld, dem zuzustimmen (bzw. den Verlag zur Beantragung einer solchen Nummer zu autorisieren) sah das Fahnen-Formular nicht vor.

Wissenschaft lebt von Publikationen (nämlich Forschungsergebnissen), die andere lesen und zitieren. Hierfür ist der Autorenname üblicherweise zu nennen. Gleichwohl lassen sich auch anonyme, pseudonyme oder durch Institutionen publizierte Dokumente problemlos wissenschaftlich nutzen und auch korrekt nachweisen. Der TEXT muss identifizierbar sein. Autoren-Identitäten sind arbiträr. Diese zu kennen, dient auch nicht der Qualitätssicherung, die in der Wissenschaft ja der einzelnen Leistung gilt. Hier zählen die Korrektheit aller Belege, redaktionelle oder andere Filter- und Begutachtungssysteme sowie über viele weitere Selektions- und Individualisierungsmechanismen eines Publikats bzw. einer Forschungsleistung laufen.

Warum also ist nun eine ORCID-Nummer? Das Akronym steht für “Open Researcher and Contributor ID”. Die Nachfrage bei einem befreundeten Bibliothekar ergibt, Bibliotheksinformationssysteme seien unter anderem an der sogenannten „Disambiguierung“ von Eigennamen interessiert. Zehn Petra Müllers will man unterscheiden können. Ganz stimmig finde ich diese Auskunft nicht, da die Findbarkeit von Medien nicht davon abhängt und Kataloge keine Biografien sein müssen. Überdies: In einer Bibliothek mit Regensburger Aufstellung stünden die Bücher der zehn Petra Müllers – gleiches Fachgebiet vorausgesetzt – im Regal ggf. dennoch wieder nebeneinander. Tatsächlich, räumt mein Gesprächspartner ein, habe es schon etwas mit dem weltweiten Datenabgleich zu tun. Für mich nehme ich mit: Es geht nicht nur um die Personenzuordnung von Publikationen, sondern auch darum, um Nachfragezahlen (Anschaffungen, Klicks, Downloads) und damit wissenschaftliche Reputation, die „Relevanz“ von Autoren generell zu messen. Und eben auch konkret: von noch lebenden, schreibenden Wissenschaftler*innen.

Was also ist ORCID? Kein rein kommerzielles Unternehmen, aber auch keine öffentliche Institution. Vielmehr ein Intermediär, der sich selbst herausgebildet hat:

“ORCID is a non-profit organization supported by a global community of member organizations, including research institutions, publishers, funders, professional associations, service providers, and other stakeholders in the research ecosystem.”[1]

Die ORCID-Webseite präsentiert den Besitz einer eigenen Nummer im Stil eines Unverwechselbarkeits­versprechens:

„ORCID provides a persistent digital identifier (an ORCID iD) that you own and control, and that distinguishes you from every other researcher.”[2]

Unterscheiden von allen anderen? Eine deutsche Bibliothekswebseite erläutert den Nutzen der Nummer wie folgt:

„Publizierende sind eindeutig identifizierbar und authentifizierbar, trotz möglicher Namensvarianten, Namenswechsel, unterschiedlicher Schreibweisen oder ‚Namensvetterschaft‘ bei häufig vorkommenden Familiennamen. Publikationen sind den Urhebern eindeutig zugeordnet und auffindbar, auch wenn sie nicht in den großen Datenbanken nachgewiesen sind. Bei einem Wechsel der institutionellen Zugehörigkeit oder „Affiliation“ bleibt die individuelle ORCID-ID erhalten und weiter nutzbar. Publikationslisten bei ORCID bleiben stets aktuell, sofern automatische Aktualisierungen im eigenen Profil erlaubt werden.“[3]

Tatsächlich erinnere ich mich an eine seufzende Kollegin: Weil sie nun mal Petra Müller heiße, werde an ihrer Universität der H-Faktor verkehrt errechnet. Das sei ein Wettbewerbsnachteil, auch gegenüber dem Rektorat. Hingegen erinnere ich mich nicht an eine Kollegin, die nach dem Wechsel an eine andere Institution ihre Publikationsliste verloren oder dank ORCID gerettet hätte. Ebenso kann ich mir nicht vorstellen, dass ein Verlag sich derart rührend um den umzugsübergreifenden Fortbestand von Publikationslisten auf Seiten seiner Autorinnen kümmert, dass er mich deshalb von sich aus bei ORCID anmelden möchte.

Ziemlich klar ist vielmehr: Es geht um automatisierte Zugriffe auf Autor*innen und letztlich auf den „Menschen“ hinter dem Autor. Man will Maßzahlen zuordnen können. Allem voran das „Ranking“ von Publikations- und Zitationsvolumina. Unterscheiden von allen anderen – das postuliert also, dass man sich gemessen weiß und dann besser messbar sein will oder muss.

ORCID wird getragen durch Mitgliedsbeiträge, im „Board“ sitzen Vertreter*innen internationaler Forschungseinrichtungen, aber auch eine Vertreterin des Verlages PLOS und eine Vertreterin von Springer Nature. Ein beim Wellcome Trust tätiger Brite ist Direktor des Boards. Aus Deutschland oder Frankreich scheint niemand im Board beteiligt. In Deutschland firmieren die DFG, DLR, das Forschungszentrum Jülich, die Deutsche Nationalbibliothek (DNB), viele Universitäten, aber auch die Walter de Gruyter GmbH als Mitwirkende von ORCID.[4]

Wieviel Wirtschaft, wieviel öffentliches Interesse steckt also drin? Wikipedia spricht recht eindeutig von einer „Firmengründung“ im Jahr 2010. „Zu den Gründungsmitgliedern von ORCID gehören wissenschaftliche Verlagsgruppen (beispielsweise ElsevierNature Publishing GroupSpringer) und Forschungsorganisationen (beispielsweise EMBOCERN).“[5]

Zum 1. Januar 2016 hätten mehrere Verlage für wissenschaftliche Publikationen (z. B. Royal SocietyPLOS) eine obligatorische Identifikation per ORCID für die einreichenden Autoren wissenschaftlicher Manuskripte eingeführt.[6]

„ORCID verfolgt das Ziel, seine Identifizierungsnummer im Sinne eines ‚enter once, reuse often‘ (einmal erfassen, vielfach nachnutzen) zum De-facto-Standard für die Autorenidentifikation im Wissenschaftsbetrieb zu machen, das heißt in Publikationen, Forschungsförderprogrammen, Peer Reviews und so weiter.[10] Die Planungen für ORCID wurden 2010 auf Umfragen gestützt.[11] ORCID-iDs sollen die elektronische Zuordnung von Publikationen und anderen Forschungsaktivitäten und -erzeugnissen zu Forschern erleichtern. Dies ist aufgrund der Personennamen alleine nicht sicher möglich, da verschiedene Autoren gleiche Namen haben können, Namen sich ändern können (beispielsweise bei Heirat), und wegen Schreibvarianten (beispielsweise einmal die ausgeschriebenen Vornamen, ein anderes Mal aber nur die Initialen).[12] Zudem erleichtern Identifikatoren die maschinelle Datenverarbeitung.“[7]

Die Deutsche Sub-Struktur von ORCID wird (einschließlich eines „Monitors“, der die Verwendung nachhält[8]) durch die DFG gefördert und über DINI vernetzt. Die Bibliotheken machen dafür unverhohlen Werbung – wiederum mit dem angeblichen Publikationslisten-Vorteil:

„Die ORCID iD (Open Researcher and Contributor iD) ist eine ID für Forschende, die ihnen u. a. die Pflege ihrer Publikationsliste erleichtert. Jede Person, die im wissenschaftlichen Arbeitsprozess einen Beitrag leistet, kann sich über ihre ORCID iD mit ihren Publikationen, Forschungsdaten und anderen Produkten des Forschungsprozesses (z. B. Forschungssoftware) eindeutig vernetzen. Damit werden diese Objekte sichtbar und technisch verlässlich mit ihren Erschafferinnen und Erschaffern verbunden. Die internationale non-profit Organisation ORCID vernetzt weltweit bereits 12,3 Millionen Publizierende mit ihren Aufsätzen, Forschungsdaten und anderen Informationsobjekten über die globaleindeutige und dauerhaft zitierbare ORCID iD. […] Ziel des DFG-Projekts ORCID DE ist es, die Implementierung von ORCID an Hochschulen und außeruniversitären Forschungseinrichtungen durch einen übergreifenden Ansatz nachhaltig zu unterstützen. Dabei stehen organisatorische, technische und rechtliche Fragen gleichermaßen im Fokus. Neben der Schaffung einer zentralen Anlaufstelle für Hochschulen und außeruniversitäre Forschungseinrichtungen stehen die Vernetzung und Verbreitung der ORCID iD im Bereich digitaler Informationsinfrastrukturen im Fokus des Vorhabens. Hierzu wird u. a. die Vernetzung mit der Gemeinsamen Normdatei (GND) vorangetrieben. Weiter widmet sich das Projekt den Herausforderungen der Etablierung eines „Organization Identifiers“ für wissenschaftliche Institutionen. Projektpartner von ORCID DE sind DataCite, die Deutsche Nationalbibliothek, das Helmholtz Open Science Office am Deutschen GeoForschungsZentrum GFZ, die Universitätsbibliothek Bielefeld und die Technische Informationsbibliothek (TIB). Das Projekt wurde durch die Deutsche Initiative für Netzwerkinformation (DINI) initiiert.“[9]

Die gemeinsame Normdatei (GND) der Deutschen Nationalbibliothek scheint mit ORCID verbunden zu sein (oder wird abgeglichen?) und Erweiterung der Autorenerfassung ist geplant:

„Bislang war die GND im Wesentlichen auf eine bibliothekarische Nutzung ausgerichtet. Zukünftig will die GND-Kooperative den Kreis der Nutzer und Nutzerinnen erweitern und sich verschiedenen Anwendern und Anwenderinnen aus Kultur und Wissenschaft öffnen: Auf der Grundlage eines mehrjährigen Entwicklungsprogramms soll ein spartenübergreifendes Produkt entstehen.“[10]

ORCID wirbt mit „Benefits for publishers“[11]. Unter anderem so:

“Improve data collection by easily discovering previously published works, datasets, affiliations and funding received by the researchers your systems interact with. Use them to pre-populate forms, join data with papers, and acknowledge funding, and [i]mprove visibility of your local profile pages by updating ORCID records to point to them.“[12]

“Reward peer reviewers and editors by giving them credit for their efforts by updating their records, [i]dentify reviewers and assign review tasks based on previous contributions and activities, and [a]ssist editors by providing more details about the authors.“[13]

“Reduce administrative burden by automatically updating ORCID records when works are published so they’re discoverable by other systems, including funders, indexers and research organizations“[14]

Ist das noch Bibliometrie oder schon Vermessung bzw. Vermarktung meiner Person? Tatsächlich adressiert ORCID auch die Wissenschaftler*innen mit Self-Tracking-Optionen. „Sign in“ werden mit Google und Facebook angeboten. Mit dem Member oder Premium Member Status kann man sich Ergebnisse zu Datenanalysen liefern lassen, die eigenen Publikationen betreffend. Ebenso gibt es Community Events und andere Angebote.[15]

Getarnt als informationswissenschaftliches Erfordernis stecken also durchaus Profitinteressen hinter der „ID“. Zudem ignoriert man – mit freundlicher Unterstützung von DFG und den Bibliotheken – die DSGVO. Denn ORCID transferiert Daten auf US-Server und ist damit seit dem letzten EuGH-Urteil datenschutzwidrig. Das macht nicht nur den Paternalismus eines Verlags, der mir die Nummer einfach verpassen will, zu einem Grundrechtsverstoß, sondern auch die diversen automatischen Updates (von deren genauem Inhalt man ebenso wenig erfährt wie von der genauen Nutzung und den Nutzern der an ORCID gegebenen Daten).[16]

Was Datenschützer ebenso stören dürfte: Man kann im System die eigenen Informationen zwar verwalten, aber nicht ändern, sondern nur die öffentliche Sichtbarkeit von Angaben unterdrücken, die man für falsch hält oder nicht eingetragen sehen will. Und dort, wo ORCID sich mit anderen Datenbanken abstimmt, geschieht dies nicht auf Basis der sichtbaren, sondern der dahinterliegenden, nach der Eingabe nicht veränderbaren Daten.

Es gibt andere Autorenidentifikationssysteme als ORCID. Etwa AuthorClaim, der Nachfolger eines Ökonomen-Netzwerks, ISNI, ein Unternehmen aus UK, an welchem Bibliotheksvertreter beteiligt sind, und ReseacherID des Datenanalytik-Konzerns Clarivate, der das Web of Science betreibt. Keiner von diesen dürfte als besser oder vertrauenswürdiger gelten. Aber … ist es eine Empfehlung, sich als das kleinste Übel durchgesetzt zu haben? Ich frage mich nochmals: Wozu – wenn nicht zur Überwachung und zum Verkauf personalisierter Services – benötigt man die Autorenidentifikation überhaupt?


[1] https://orcid.org/  [28.9.2021]

[2] https://orcid.org/  [28.9.2021]

[3] https://www.ub.uni-osnabrueck.de/publizieren_archivieren/orcid.html [28.9.2021]

[4] https://orcid.org/members  [28.92021]

[5] https://de.wikipedia.org/wiki/ORCID  [28.9.2021]

[6] https://de.wikipedia.org/wiki/ORCID  [28.9.2021]

[7] https://de.wikipedia.org/wiki/ORCID  [28.9.2021]

[8] Vgl. https://monitor.orcid-de.org/about.php  [28.9.2021]

[9] https://www.orcid-de.org/  [28.9.2021]

[10] https://www.dnb.de/DE/Professionell/Standardisierung/GND/gnd_node.html  [28.9.2021]

[11] https://info.orcid.org/orcid-for-publishers/  [28.9.2021]

[12] https://info.orcid.org/orcid-for-publishers/  [28.9.2021]

[13] https://info.orcid.org/orcid-for-publishers/  [28.9.2021]

[14] https://info.orcid.org/orcid-for-publishers/  [28.9.2021]

[15] Vgl. https://info.orcid.org/about-membership/  [28.9.2021]

[16] ORCID unterscheidet auch US-Bürger und Nicht-US-Bürger nicht. „It is not likely that ORCID would be subject to US surveillance law requests highlighted in the Schrems II decision.” https://info.orcid.org/our-principles-policies/faq-orcid-and-ecj-schrems-ii-decision/#easy-faq-13381  [28.9.2021]