Aufbau eines Volltext-Korpus der Allgemeinen Literatur-Zeitung
Digitaler Volltext-Korpus
Prof. Dr. Udo Hahn
Friedrich-Schiller-Universität Jena
Fürstengraben 30
07743 Jena
Udo.Hahn@uni-jena.de
Website
Die Allgemeine Literatur-Zeitung (ALZ), die zwischen 1785 und 1849 in Jena (bis 1803) und Halle (ab 1804) erschienen ist, gilt als das größte Rezensionsorgan Deutschlands um 1800. Ihr ursprüngliches Ziel war, alle gedruckten Bücher zu rezensieren. Auch wenn das Ziel wegen der wachsenden Menge der Publikationen bald aufgegeben werden musste, umfasst die ALZ wichtige Rezensionen, die u.a. von Goethe, Schlegel und Fichte verfasst wurden. Der Erscheinungszeitraum umfasst den Übergang von der Aufklärung zur Romantik (vgl. zur Bedeutung der ALZ: Matuschek 2004).
Aufgrund der Bedeutung der ALZ wurde zwischen 2007 und 2012 ein umfangreiches, durch die DFG finanziertes Projekt Digitalisierung, Erschließung und Online-Präsentation der Allgemeine Literatur-Zeitung in Jena und Weimar durchgeführt. Im Rahmen des Projekts wurde die ALZ systematisch digitalisiert und deren Metadaten umfangreich erschlossen. Allerdings liegen keine durchsuchbaren Volltexte vor. Im Graduiertenkolleg Modell Romantik wird zunehmend gefragt, ob es nicht möglich wäre, durch up-to-date Methoden ein vollständiges und durchsuchbares Volltext-Korpus zu erstellen. Dies könnte neue Forschungsmöglichkeiten eröffnen - wie z.B. die Untersuchung der semantischen Veränderung romantik-relevanter Wörter. Tinghui Duan (Digital Humanities) hat diese Herausforderung angenommen und (betreut von Prof. Udo Hahn (Computerlinguistik)) ein Volltext-Korpus aufgebaut, das aktuell 261 Bände, 126.612 Seiten bzw. 120.369.005 Tokens (laufende Wörter) umfasst. Dieser Umfang entspricht ungefähr 82% der gesamten ALZ (vgl. Hahn & Duan 2019). Das gesamte Korpus steht zum Herunterladen und Weiterverarbeiten unter github.com/JULIELab/alz zur Verfügung.
Literatur
Udo Hahn/Tinghui Duan: „Corpus Assembly as Text Data Integration from Digital Libraries and the Web", in: JCDL ’19: Proceedings of the 2019 ACM/IEEE Joint Conference on Digital Libraries, June 02–06, 2019, Urbana-Champaign, IL, USA.
https://julielab.de/downloads/publications/papers/Hahn_Duan_2019_JCDL.pdf