Institutionenkodierung als Grundlage für bibliometrische Indikatoren
DOI:
https://doi.org/10.5283/bpf.209Abstract
Die nicht standardisierte, fehlerhafte und unvollständige Erfassung von Autorenadressen („Affiliations“) in den großen interdisziplinären Literaturdatenbanken Web of Science (WoS) und Scopus stellt eine erhebliche Herausforderung für bibliometrische Analysen überall dort dar, wo es auf eine genaue und verlässliche Zuordnung der Publikationen zu Institutionen ankommt. Mit den Autorenadressen sind eine Reihe von Problemen verbunden, für die es nicht in jedem Fall einfache Lösungen gibt. Am bekanntesten ist das Problem der unterschiedlichen Schreibweisen („spelling variants“) von Adressen, dem die Datenbankhersteller seit einiger Zeit durch eigene Bemühungen zur (Teil-) Standardisierung der Adresseinträge zu begegnen versuchen. Diesen Ansätzen sind jedoch Grenzen gesetzt, auch weil die Adressangaben schon in den Originalartikeln der wissenschaftlichen Zeitschriften nicht selten ungenau und unvollständig sind. Die Zeitschriften arbeiten mit unterschiedlichen (bzw. gar keinen) Vorgaben für die Autoren hinsichtlich der Nennung der relevanten Adressen und auch die Forschungsinstitutionen selbst machen in Deutschland bisher überwiegend keine entsprechenden Vorgaben für ihre eigenen Mitarbeiter.
Bei der Zuordnung der Autorenadressen zu Forschungseinrichtungen geht es aber um mehr als eine bloße Vereinheitlichung unterschiedlicher Schreibweisen. Neben der grundlegenden Aufgabe einer Zusammenfassung bzw. Standardisierung der auftretenden Varianten von Institutionsnamen stellt vor allem die Identifikation der jeweils „richtigen“ real (in Gegenwart oder Vergangenheit) existierenden Institution zu den Adressen eine Herausforderung dar. Nicht nur fehlende Standards zur Angabe von Adressen in wissenschaftlichen Publikationen, sondern auch komplexe institutionelle Strukturen (z.B. Hierarchien oder Beziehungen zwischen Institutionen) und ihr Wandel über die Zeit können eine eindeutige Zuordnung erheblich erschweren.
In diesem Beitrag werden Ergebnisse eines Projekts vorgestellt, das im Kontext des im Aufbau befindlichen Kompetenzzentrums Bibliometrie für die deutsche Wissenschaft durchgeführt wird. Das Projekt hat die Gewinnung einer möglichst vollständigen, verlässlichen und nachhaltig nutzbaren Zuordnung der in WoS bzw. Scopus erfassten Publikationen mit deutschen Adressen zu real existierenden deutschen Institutionen zum Ziel. Die Ergebnisse werden mit einem teilautomatischen Verfahren erzielt, in dem die Erkennung von Textmustern in den Adressen eine wesentliche Rolle spielt. Zur Abbildung der Institutionendynamik werden auch Daten mit Zeitangaben zur Entwicklung der Institutionen und Sektoren der deutschen Forschungslandschaft erfasst. Ein Informationsaustausch mit interessierten Hochschulen und außeruniversitären Forschungseinrichtungen in Deutschland ist in Bezug auf die sie jeweils betreffenden Datensätze möglich, soweit die lizenzrechtlichen Voraussetzungen erfüllt sind.
Literaturhinweise
Downloads
Veröffentlicht
Ausgabe
Rubrik
Lizenz
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung 4.0 International.