Claudia Resch, Nora Fischer, Dario Kampkaspar, Daniel Schopper
Das DIGITARIUM ist eine Digitale Edition von mehreren hundert Ausgaben der Wiener Zeitung (vormals Wien[n]erisches Diarium) aus dem 18. Jahrhundert, die im Volltext erschlossen werden. Das Wien[n]erische Diarium gilt als das bedeutendste Medium der Habsburgermonarchie des 18. Jahrhunderts. Allein die Tatsache, dass die Zeitung seit 1703 im langen 18. Jahrhundert kontinuierlich zweimal wöchentlich erschien, macht sie zu einer außerordentlich wertvollen Informationsquelle für Wissenschaftlerinnen und Wissenschaftler verschiedenster Disziplinen (u. a. Mediengeschichte, Kunstgeschichte, Musikgeschichte, Literaturwissenschaft, Zeremonialforschung, Namenforschung und historische Linguistik) sowie für eine interessierte Öffentlichkeit.
Im Rahmen des Projekts Das Wien[n]erische Diarium: Digitaler Datenschatz für die geisteswissenschaftlichen Disziplinen wurde eine exemplarische Auswahl von mehr als 300 Ausgaben des Wien[n]erischen Diarii über den gesamten Verlauf des 18. Jahrhunderts als Trainingskorpus bearbeitet, um einerseits den angesprochenen vielfältigen Forschungs- und Erkenntnisinteressen Rechnung zu tragen und andererseits neue Features des Interface- und Interaktionsdesigns sowie Anforderungen und Ideen für die Entwicklung der Forschungsumgebung zu testen.
Die Erstellung der hochwertigen Volltexte beginnt bei der Bearbeitung der Bilddigitalisate, welche zu einem überwiegenden Teil auf dem Portal AustriaN Newspapers Online (ANNO)1 der Österreichischen Nationalbibliothek zur Verfügung gestellt werden. Da nur eine hohe Bildqualität die korrekte automatische Weiterverarbeitung ermöglicht, ist es vereinzelt notwendig, diese Bilder zu verbessern, bevor sie zur automatischen Layoutanalyse (OLR) und Texterkennung (OTR) in Transkribus2 hochgeladen werden können. Nach der erfolgreichen Erkennung werden die generierten Volltexte exportiert und von einer Reihe von XSLT-Skripten zu XML-Dateien im aktuellen Standard der Text Encoding Initiative (TEI P5) nachbearbeitet. Hier hat die Erfahrung gezeigt, dass aufgrund von Problemen mit dem Originaldruck (Flecken, Fältchen, Löcher und Risse des Drucks, undeutliche Buchstaben usw.), dem digitalen Bild (fehlende Schärfe usw.) oder dem Layout (Änderungen innerhalb einer Ausgabe oder des Gesamtlayouts) manuelle Korrekturen erforderlich sind, um die angestrebte hohe Textgenauigkeit zu erreichen. Diese Korrekturprozesse tragen wiederum dazu bei, Vorstufen der automatisierten Verarbeitung iterativ zu verbessern, wodurch das mittlerweile anhand von großen Textmengen trainierte Modell auch zur digitalen Transformation anderer historischer Zeitungen (z. B. der Zürcher Zeitung) angewandt werden kann.
Die abschließend korrigierten Transkriptionen werden so mit dem Bild kollationiert, dass die digitalen Volltextversionen das Wien[n]erische Diarium seiten-, zeilen-, und zeichengetreu abbilden und damit den historischen Sprachstand der Texte unverändert wiedergeben. Die solcherart mit der Erstellung der Volltexte verbundene Analyse von formalen Charakteristika (Vignetten, Schriften, Rubriken) wird einen wichtigen Beitrag zur Erforschung der Entwicklung des Zeitungslayouts leisten, das generell für das 18. Jahrhundert noch kaum untersucht ist, indem sie die Profilierung und Weiterentwicklung des vertretenen Spektrums an Textsorten zutage fördert und die Untersuchung von Techniken der Leserorientierung und Verständnisförderung ermöglicht.
Das DIGITARIUM bietet derzeit (Stand: 2020) eine Übersicht über den Bearbeitungsstand der einzelnen Ausgaben, deren Volltexte und Faksimiles synoptisch dargestellt und durchsucht werden können. Als Forschungsumgebung will das DIGITARIUM einer interdisziplinären Community neue Möglichkeiten zur Erschließung des Wien[n]erischen Diarii ermöglichen und innovative Forschung fördern. Die Expertise, welche die Projektgruppe bei der – auch international gesehen – noch wenig ausverhandelten Transformation von historischen Zeitungen erworben hat, teilt sie mit der Fachgemeinschaft in zwei neu gegründeten Arbeitsgruppen – Newspapers and Periodicals der Text Encoding Initiative (TEI) und Zeitungen und Zeitschriften der Digital Humanities im deutschsprachigen Raum (DHd).
Anmerkungen:
1 http://anno.onb.ac.at/cgi-content/anno?aid=wrz
2 https://transkribus.eu/Transkribus/
Literatur:
- Fischer, Nora. 2019. „Von Orten im Wien[n]erischen Diarium. Anmerkungen zu den Voraussetzungen einer Annotation von Ortsnamen.“ Wiener Geschichtsblätter 74 (2): 137–149.
- Kampkaspar, Dario. 2019. „Das DIGITARIUM – Volltexterstellung und Nutzungsmöglichkeiten.“ Wiener Geschichtsblätter 74 (2): 131–135.
- Mader-Kratky, Anna, Claudia Resch und Martin Scheutz. 2019. „Das Wien[n]erische Diarium im 18. Jahrhundert. Neue Sichtweisen auf ein Periodikum im Zeitalter der Digitalisierung.“ Wiener Geschichtsblätter 74 (2): 93–113.
- Resch, Claudia. 2018. „„Zeitungs Lust und Nutz“ im digitalen Zeitalter. Partizipative Ansätze zur Erschließung historischer Ausgaben der Wiener Zeitung.“ medien & zeit. Kommunikation in Vergangenheit und Gegenwart 2: 20–31.
- Resch, Claudia, Dario Kampkaspar und Daniel Schopper. 2018. „Historische Zeitungen kollaborativ erschließen: Die älteste, noch erscheinende Tageszeitung der Welt „under annotation“.“ In Kritik der digitalen Vernunft. DHd 2018 Köln. Konferenzabstracts, hrsg. v. Georg Vogeler, S. 229–232. Zugriff am 20.09.2019. http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf.
- Resch, Claudia. 2018. Historische Zeitungen im digitalen Medium. In: Germanistik digital: Digital Humanities in der Sprach- und Literaturwissenschaft. Wien: Facultas, S. 183–198.
- Resch, Claudia. 2019. „Das Wien[n]erische Diarium und seine digitale Erschließung oder „Was Zeitungsleser vor Geräte haben müssen?““ Wiener Geschichtsblätter 74 (2): 115–129.
- Resch, Claudia und Dario Kampkaspar. 2019. „DIGITARIUM – Unlocking the Treasure Trove of 18th-Century Newspapers for Digital Times.” In Digital Eighteenth Century: Central European Perspectives, hrsg. v. Thomas Wallnig, Marion Romberg u. Joelle Weis, 49–64. Wien, Köln u. Weimar: Böhlau.
- Resch, Claudia. (im Druck): Volltextoptimierung für die historische „Wiener Zeitung“ - Ein Anwendungsszenario aus der historischen Sprachwissenschaft. In: Digitised Newspapers – a New Eldorado for Historians? Epistemology, methodology, tools and the changing practice of history in the context of mass digitisation of newspapers. Berlin, Boston: de Gruyter.