Text und Data Mining
Benötigen Sie im Rahmen eines Forschungsprojekts große Mengen von Artikeln aus Volltextdatenbanken, z. B. Jahrgänge einer Zeitung, um diese zu Analysezwecken softwaregestützt aufzubereiten und zu untersuchen, werden zusätzliche Nutzungsrechte zur Speicherung, Vervielfältigung und Archivierung der Daten benötigt. Während einige Verlage diese für lizenzierte Inhalte für Forschende über die allgemeinen Lizenzen für nicht-kommerzielle Zwecke gewähren, gestattet die Mehrzahl der von uns lizenzierten Datenbanken den Download großer Textmengen nicht. Das automatisierte Suchen und Herunterladen (Scrawling) von Daten aus unseren lizenzierten Datenbanken ist grundsätzlich nicht gestattet.
Bitte fragen Sie uns, bevor Sie ein konkretes Projekt planen.
Schreiben Sie eine Mail an bib-datenbanken.wiso"AT"uni-hamburg.de, wenn Sie Daten aus unseren lizenzierten Datenbanken für Ihr Studien- oder Forschungsprojekt benötigen. Wir prüfen dann die rechtliche Lage auf Basis des Urheberrechtsgesetz und unseres Lizenzvertrages. Werden diese Rechte nicht eingeholt, sperrt das anbietende Unternehmen den Zugriff auf die Datenbank für alle Angehörigen der UHH.
Die folgenden Angaben geben eine erste Orientierung (für UHH-Angehörige).
Text und Data Mining im deutschen Urheberrecht (§60d UrhG)
2018 wurde im deutschen Urheberrecht mit § 60d UrhG eine gesetzliche Erlaubnis für Text- und Data-Mining eingeführt.
Mit dem Gesetz zur Anpassung des Urheberrechts an die Erfordernisse des digitalen Binnenmarktes vom 31.05.2021 (BGBl. I S. 1204), in Kraft getreten am 07.06.2021, wurde § 60h Abs. 2 Nr. 3 UrhG neu eingefügt. Danach sind Vervielfältigungen im Rahmen des Text und Data Mining für Zwecke der wissenschaftlichen Forschung nach § 60d Abs. 1 UrhG nun vergütungsfrei.
Bitte beachten Sie zu rechtlichen Aspekten die Ausführungen zu Rechte und Pflichten > Text- und Data-Mining des Projekts forschungsdaten.info.
Bitte beachten Sie in diesem Zusammenhang, dass
- der automatisierte Abruf nur zum Zwecke von Text und Data Mining nach dem Gesetz und dem Lizenzvertrag erlaubt ist.
Zu Vervielfältigungen im Rahmen von TDM berechtigt sind einzelne Forscher:innen, sofern sie nicht kommerzielle Zwecke verfolgen. Ggfs. können Sie vom Anbieter aufgefordert werden, diesem den Titel des Forschungsprojektes sowie eine Bestätigung, dass dieses zu nicht-kommerziellen Zwecken durchgeführt wird, zukommen zu lassen; - das TDM-Korpus (also die zum Zwecke der Auswertung im Rahmen Ihres Forschungsvorhabens erstellten Vervielfältigungen) zu löschen ist, wenn es für das Text- und Data Mining nicht mehr erforderlich ist (§ 44 Abs. 2 UrhG). Eine längere Speicherung kann aber durch Forschungseinrichtungen (z.B. die Hochschule) und auch durch die Hochschulbibliothek gemäß § 60d UrhG erfolgen.
Erste Erfahrungen aus bibliothekarischer und juristischer Sicht werden in den folgenden Artikeln beschreiben:
- Brettschneider, P. (2021). Text und Data-Mining – juristische Fallstricke und bibliothekarische Handlungsfelder, Bibliotheksdienst, 55(2), 104-126. DOI: 10.1515/bd-2021-0020
- Schöch, C. et al. (2020): Abgeleitete Textformate – Text und Data Mining mit urheberrechtlich geschützten Textbeständen. In: Zeitschrift für digitale Geisteswissenschaften, (5). DOI: 10.17175/2020_00
Einführung zu TDM-Lizenzen und ihren Herausforderungen
Wie in der Auflistung ersichtlich, stehen Forschende und Bibliotheken vor diversen Herausforderung bei der Lizenzierung von Daten für TDM-Projekte. Einen guten internationalen Überblick gibt der folgende Artikel:
- McCracken, P. & Raub, E. (2023). Licensing Challenges Associated With Text and Data Mining – How Do We Get Our Patrons What They Need? In: Journal of Librarianship and Scholarly Communication, 11(1), eP15530. DOI: 10.31274/jlsc.1553