Institutionenkodierung als Grundlage für bibliometrische Indikatoren

Autor/innen

  • Matthias Winterhager Universität Bielefeld
  • Holger Schwechheimer Universität Bielefeld Institut for Interdisciplinary Studies of Science (I²SoS)
  • Christine Rimmert Universität Bilefeld Institut for Interdisciplinary Studies of Science (I²SoS)

DOI:

https://doi.org/10.5283/bpf.209

Abstract

Die nicht standardisierte, fehlerhafte und unvollständige Erfassung von Autorenadressen („Affiliations“) in den großen interdisziplinären Literaturdatenbanken Web of Science (WoS) und Scopus stellt eine erhebliche Herausforderung für bibliometrische Analysen überall dort dar, wo es auf eine genaue und verlässliche Zuordnung der Publikationen zu Institutionen ankommt. Mit den Autorenadressen sind eine Reihe von Problemen verbunden, für die es nicht in jedem Fall einfache Lösungen gibt. Am bekanntesten ist das Problem der unterschiedlichen Schreibweisen („spelling variants“) von Adressen, dem die Datenbankhersteller seit einiger Zeit durch eigene Bemühungen zur (Teil-) Standardisierung der Adresseinträge zu begegnen versuchen. Diesen Ansätzen sind jedoch Grenzen gesetzt, auch weil die Adressangaben schon in den Originalartikeln der wissenschaftlichen Zeitschriften nicht selten ungenau und unvollständig sind. Die Zeitschriften arbeiten mit unterschiedlichen (bzw. gar keinen) Vorgaben für die Autoren hinsichtlich der Nennung der relevanten Adressen und auch die Forschungsinstitutionen selbst machen in Deutschland bisher überwiegend keine entsprechenden Vorgaben für ihre eigenen Mitarbeiter.

Bei der Zuordnung der Autorenadressen zu Forschungseinrichtungen geht es aber um mehr als eine bloße Vereinheitlichung unterschiedlicher Schreibweisen. Neben der grundlegenden Aufgabe einer Zusammenfassung bzw. Standardisierung der auftretenden Varianten von Institutionsnamen stellt vor allem die Identifikation der jeweils „richtigen“ real (in Gegenwart oder Vergangenheit) existierenden Institution zu den Adressen eine Herausforderung dar. Nicht nur fehlende Standards zur Angabe von Adressen in wissenschaftlichen Publikationen, sondern auch komplexe institutionelle Strukturen (z.B. Hierarchien oder Beziehungen zwischen Institutionen) und ihr Wandel über die Zeit können eine eindeutige Zuordnung erheblich erschweren.

In diesem Beitrag werden Ergebnisse eines Projekts vorgestellt, das im Kontext des im Aufbau befindlichen Kompetenzzentrums Bibliometrie für die deutsche Wissenschaft durchgeführt wird. Das Projekt hat die Gewinnung einer möglichst vollständigen, verlässlichen und nachhaltig nutzbaren Zuordnung der in WoS bzw. Scopus erfassten Publikationen mit deutschen Adressen zu real existierenden deutschen Institutionen zum Ziel. Die Ergebnisse werden mit einem teilautomatischen Verfahren erzielt, in dem die Erkennung von Textmustern in den Adressen eine wesentliche Rolle spielt. Zur Abbildung der Institutionendynamik werden auch Daten mit Zeitangaben zur Entwicklung der Institutionen und Sektoren der deutschen Forschungslandschaft erfasst. Ein Informationsaustausch mit interessierten Hochschulen und außeruniversitären Forschungseinrichtungen in Deutschland ist in Bezug auf die sie jeweils betreffenden Datensätze möglich, soweit die lizenzrechtlichen Voraussetzungen erfüllt sind.

Literaturhinweise

<p class="sdfootnote-western"><span lang="de-DE">Bornmann, L., Marx, W., &amp; Winterhager, M. (2012). Wahrheit und Klarheit. Uneinheitliche Namen von Universitäten und ihre Folgen für die Forschungsevaluation. </span><em><span lang="de-DE">Forschung &amp; Lehre</span></em><span lang="de-DE">, </span><em><span lang="de-DE">19</span></em><span lang="de-DE">(8), 650&ndash;651. &lt;<a class="western" href="http://www.forschung-und-lehre.de/wordpress/Archiv/2012/ful_08-2012.pdf">http://www.forschung-und-lehre.de/wordpress/Archiv/2012/ful_08-2012.pdf</a>&gt;</span></p><p class="sdfootnote-western"><span style="color: #000000;"><span style="background: transparent;">Cuxac, P., Lamirel, J.-C., &amp; Bonvallot, V. (2013). Efficient supervised and semi-supervised approaches for affiliations disambiguation. Scientometrics. doi:</span></span><a class="western" href="http://dx.doi.org/10.1007/s11192-013-1025-5">10.1007/s11192-013-1025-5</a><span style="color: #000000;"><span style="background: transparent;">.</span></span></p><p class="sdfootnote-western" lang="en-GB">De Bruin, R. E. &amp; Moed, H. F. (1990), The unification of addresses in scientific publications. In: L. Egghe, R. Rousseau (Eds), Informetrics 1989/90. Elsevier Science Publishers, Amsterdam, pp. 65&ndash;78. &lt;<a class="western" href="http://doclib.uhasselt.be/dspace/bitstream/1942/850/1/debruin65.pdf">http://doclib.uhasselt.be/dspace/bitstream/1942/850/1/debruin65.pdf</a>&gt;</p><p class="sdfootnote-western"><span lang="en-GB">Enserink, M. (2009), Scientific Publishing: Are You Ready to Become a Number? Science 323, Nr. 5922 (</span>27 March<span lang="en-GB">): 1662-1664. doi:<a class="western" href="http://dx.doi.org/10.1126/science.323.5922.1662">10.1126/science.323.5922.1662</a>.</span></p><p class="sdfootnote-western" lang="en-GB">Galvez, C. &amp; Moya-Aneg&oacute;n, F. (2006), The unification of institutional addresses applying parametrized finite-state graphs (P-FSG). Scientometrics 69(2), 323-345. doi: <a class="western" href="http://dx.doi.org/10.1007/s11192-006-0156-3">10.1007/s11192-006-0156-3</a></p><p class="sdfootnote-western" lang="en-GB">Galvez, C. &amp; Moya-Aneg&oacute;n, F. (2007), Standardizing formats of corporate source data. Scientometrics, 70(1), 3-26. doi: <a class="western" href="http://dx.doi.org/10.1007/s11192-007-0101-0">10.1007/s11192-007-0101-0</a>.</p><p class="sdfootnote-western"><span lang="en-GB">Hardeman, S. (2013). Organization level research in scientometrics: a plea for an explicit pragmatic approach. Scientometrics, 94:1175&ndash;1194. doi: </span><a class="western" href="http://dx.doi.org/10.1007/s11192-012-0806-6">10.1007/s11192-012-0806-6</a><span lang="en-GB">.</span></p><p class="sdfootnote-western">Huang, S., Yang, B., Yan, S., &amp; Rousseau, R. (2014). Institution name disambiguation for research assessment. Scientometrics, 99(3), 823&ndash;838. doi:<a class="western" href="http://dx.doi.org/10.1007/s11192-013-1214-2">10.1007/s11192-013-1214-2</a></p><p class="sdfootnote-western"><span lang="en-GB">Moed, H., De Bruin, R. &amp; Van Leeuwen, T. (1995), New bibliometric tools for the assessment of national research performance: Database description, overview of indicators and first applications. </span><span lang="de-DE">Scientometrics, 33(3), 381-422. doi: <a class="western" href="http://dx.doi.org/10.1007/BF02017338">10.1007/BF02017338</a>.</span></p><p class="sdfootnote-western">Morillo, F., Aparicio, J., Gonz&aacute;lez-Albo, B. und Moreno, L. (2013) Towards the Automation of Address Identification. Scientometrics 94 (1): 207&ndash;24. doi:<a class="western" href="http://dx.doi.org/10.1007/s11192-012-0733-6">10.1007/s11192-012-0733-6</a>.</p><p class="sdfootnote-western">Praal F.E.W., Kosten M.J.F., Calero Medina C. &amp; Visser M.S. (2013), Ranking universities: The challenge of affiliated institutes. In: Hinze, S., Lottmann A. (Eds.) Proceedings of the 18th International conference on Science and Technology Indicators: Translational Twists and Turns: Science as a Socio-Economic Endeavour. Berlin: IFQ. 284-289. <a class="western" href="http://www.forschungsinfo.de/STI2013/download/STI_2013_Proceedings.pdf">http://www.forschungsinfo.de/STI2013/download/STI_2013_Proceedings.pdf</a></p><p class="sdfootnote-western"><span lang="de-DE">Wissenschaftsrat (2008), Bericht der Steuerungsgruppe zur Pilotstudie Forschungsrating Chemie und Soziologie. Köln. </span><a class="western" href="http://www.wissenschaftsrat.de/download/archiv/8453-08.pdf"><span lang="de-DE">http://www.wissenschaftsrat.de/download/archiv/8453-08.pdf</span></a></p>

Veröffentlicht

2014-11-10

Ausgabe

Rubrik

Konferenzbeiträge