Wer hat das gesagt? – Zitate als Forschungsobjekt

Originalzitate stellen eine wertvolle und unverfälschte Informationsquelle dar – für die Presse, aber auch für die Wissenschaft. Mit „Quotebank“ stellen der Informatiker Andreas Spitz und seine Schweizer Kollegen einen Datensatz mit 235 Millionen Zitaten zur freien Verfügung.
© “Haanala 76”; License: CC0 Public Domain

Das direkte Zitieren von Personen ist eine gängige Praxis im Journalismus. Wörtliche Zitate erlauben eine genaue Darstellung dessen, was gesagt wurde, und verleihen einem Bericht so Authentizität. Gerade diese Unverfälschtheit macht wörtliche Zitate auch zu einem interessanten Forschungsobjekt, sei es in den Sprachwissenschaften, um sprachliche Entwicklungen zu beschreiben, oder in den Politik- und Sozialwissenschaften, beispielsweise um aus öffentlichen Äußerungen gesellschaftliche oder politische Trends abzuleiten.

In einem frei zugänglichen Tagungsbeitrag gibt Andreas Spitz vom Fachbereich Informatik und Informationswissenschaft der Universität Konstanz gemeinsam mit Kollegen von der École polytechnique fédérale de Lausanne (EPFL; Schweiz) und der Eidgenössischen Technischen Hochschule Zürich (ETH Zürich; Schweiz) ein Anwendungsbeispiel: Anhand von über 6,7 Millionen politischen Zitaten und ihrer sprachlichen Einbettung in den Text untersuchten sie mögliche Veränderungen in der Parteilichkeit von US-Medien zwischen 2013 und 2020. In einer verwandten Open-Access-Studie untersuchte das Team mit weiteren Kollegen die ansteigende Negativität im Tonfall von durch Nachrichtenmedien berichteten Zitaten.

Beide Projekte verwendeten Zitate aus Quotebank, einer frei nutzbaren Datenbank mit 235 Millionen Zitaten aus englischsprachigen Nachrichtenartikeln, an deren Erstellung Spitz ebenfalls beteiligt war.


Quotebank (doi: 10.5281/zenodo.4277310), ein Datensatz mit 235 Millionen Zitaten aus englischsprachigen Nachrichtenartikeln aus den Jahren 2008 bis 2020, steht in dem Datenrepositorium Zenodo zum kostenlosen Download bereit.


Für eine Suche in der Zitatdatenbank steht auch ein kostenfreies Web-Interface zur Verfügung.


Der Tagungsbeitrag (International AAAI Conference on Web and Social Media 2023) „Quotatives Indicate Decline in Objectivity in U.S. Political News“ ist als Open-Access-Artikel frei zugänglich.


Der Replikationsdatensatz (doi: 10.5281/zenodo.7983077) zu der Studie steht ebenfalls auf Zenodo zum freien Download zur Verfügung.


Die verwendeten Auswertungsskripte stehen als Jupyter Notebooks im GitHub-Verzeichnis des EPFL Data Science Lab zur freien Verfügung.


Der Fachartikel „United States politicians’ tone became more negative with 2016 primary campaigns“ (doi: 10.1038/s41598-023-36839-1) ist ebenfalls inklusive Replikationsdaten und Code als Open-Access-Artikel erschienen.
 

Daniel Schmidtke

Von Daniel Schmidtke - 05.01.2024