Few-Shot (FS) Learning für die Automatische Inhaltsanalyse der Kommunikationswissenschaft (FLACA)
Das Verbundprojekt FLACA zielt darauf ab, den aktuellen Forschungsstand im Informatik-Bereich des Natural Language Processing in Bezug auf das Few-Shot (FS) Learning für die Automatische Inhaltsanalyse der Kommunikationswissenschaft nutzbar zu machen. In der Informatik sind in der jüngsten Vergangenheit zwei Bereiche intensiv beforscht worden, deren aktuelle Ergebnisse enormes Potenzial für die (Teil-)Automatisierung der Inhaltsanalyse (AIA) und damit auch zur Steigerung der Datenkompetenzen der Kommunikationswissenschaft insgesamt bergen: Mit vortrainierten Sprachmodellen auf Basis der neuronaler Transformernetze und darauf aufbauender Few-Shot Textklassifikation wird es möglich, inhaltliche Kategorien mit vergleichsweise wenig Trainingsdaten zuverlässig zu identifizieren. Mit Verfahren des Argument Mining wird zudem die automatische Kodierung von Argumentbestandteilen und -positionen ermöglicht. Damit werden zentrale Desiderata derzeitiger inhaltsanalytischer Forschung adressiert: die Auswertung sehr großer Textmengen mit semantisch komplexen Kategorien.
Das dafür notwendige Vorgehen und die technische Umsetzung werden im Rahmen mehrerer exemplarischer Studien, z.B. zum Framing der Waffenlieferung an die Ukraine in der deutschen Medienberichterstattung, entwickelt. Im Ergebnis werden wissenschaftliche Publikationen, Best Practices sowie Software- und e-Learning Ressourcen bereitgestellt, mit denen sich die Kommunikationswissenschaft diese neuen Technologien aus der Informatik erschließt und nach eigenen Facherfordernissen weiterentwickelt. Für die Vermittlung dieser neuen Methoden setzt FLACA ein Hauptaugenmerk auf den wissenschaftlichen Nachwuchs, für den im Rahmen von Methodenworkshops Datenkompetenzen zur AIA vermittelt werden.
Es handelt sich um ein Verbundprojekt mit dem Leibniz Institut für Medienforschung Hans-Bredow-Institut.
Das Projekt wird gefördert aus Mitteln des Aktionsplans Forschungsdaten des Bundesministeriums für Bildung und Forschung. Die Fördermaßnahme zur „Stärkung der Datenkompetenzen des wissenschaftlichen Nachwuchses“ hat zum Ziel, die Datenkompetenz des wissenschaftlichen Nachwuchses an Hochschulen und außeruniversitären Forschungseinrichtungen in den vielfältigen Fächern der Wissenschaftslandschaft durch die Verknüpfung spezialisierter datenwissenschaftlicher Fähigkeiten mit fachlichen Kenntnissen zu erweitern und zu vertiefen. Die Projekte werden aus der Aufbau- und Resilienzfazilität des EU-Aufbauplans „NextGenerationEU“ finanziert.
Zum FLACA-Team gehören:
UHH: Prof. Dr. Katharina Kleinen-von Königslöw, Dr. Gerret von Nordheim, Dr. Kostiantyn Yanchenko
Verbundpartner /HBI: Dr. Gregor Wiedemann, Dr. Jonas Rieger, Mattes Ruckdeschel
- Dauer: 2022-2025
- Projektleitung: Prof. Dr. Katharina Kleinen-von Königslöw
- Drittmittelgeber: BMBF