Galka, Selina; selina.galka@uni-graz.at
Das DTA-Basisformat (DTABf) wurde im Rahmen des DTA-Projekts (Deutsches
Textarchiv) entwickelt, um historische Drucke und Manuskripte einheitlich
auszuzeichnen, da die Richtlinien der Text Encoding Initiative (TEI) oftmals mehrere Möglichkeiten zur Kodierung von Textphänomenen
bieten, wie z. B. die Annotation von Personennamen mit <persName>
oder <name
type="person">
. Durch die Verwendung der Kodierung mit dem
DTA-Basisformat wird eine Kohärenz zwischen den modellierten Texten gewährleistet.
Das Basisformat folgt den P5-Richtlinien der TEI, allerdings wurde aus den umfangreichen Tags der Richtlinien eine Tag-Auswahl zur Textstrukturierung getroffen. Das Tag-Set wird in einer ODD-Dokumentation detailliert beschrieben, um den Variationsspielraum der Auszeichnungsmöglichkeiten möglichst gering zu halten. Die Webpräsenz des Basisformats bietet eine umfangreiche Dokumentation zu Strukturierung der Metadaten, Richtlinien zur Texterfassung, formale und inhaltliche Erschließung der Texte, Kodierung von Manuskripten und Zeitungen und eine Übersicht über alle Elemente, die im Basisformat enthalten sind; außerdem werden Schemadateien (RNG) sowie ODD zur Verfügung gestellt. Die DTABf-Schemata wurden mithilfe des Chaining-ODDs-Mechanismus der Text Encoding Initiative erstellt (DTABf: Schema).
Da das Basisformat zunehmend auch von anderen Projekten (z. B. Hugo-Schuchardt-Archiv oder in der Edition Humboldt Digital) bzw. zur Kodierung von Texten außerhalb des DTA-Projekts verwendet wird, wird es von Expertinnen und Experten für TEI-Kodierungen beständig weiterentwickelt. Änderungs- und Erweiterungsvorschläge können von Nutzerinnen und Nutzern zudem im GitHub-Repository des DTABf notiert werden.
Literatur:
- Berlin-Brandenburgischen Akademie der Wissenschaften . DTABf. Deutsches Textarchiv – Basisformat (2011–2020) . URL: http://www.deutschestextarchiv.de/doku/basisformat/
- DTABf: Schema und Dokumentation. URL: https://www.deutschestextarchiv.de/doku/basisformat/schema.html
- Dumont, Stefan; Haaf, Susanne; Seifert, Sabine. Encoding Correspondence. A Manual for Encoding Letters and Postcards in TEI-XML and DTABf . URL: https://encoding-correspondence.bbaw.de/v1/
- Haaf, Susanne. Das DTA-Basisformat in neuem Gewand. In: Im Zentrum Sprache. Untersuchungen zur deutschen Sprache in Geschichte und Gegenwart . URL: https://sprache.hypotheses.org/147
- Geyken, Alexander; Haaf, Susanne; Wiegand, Frank. 2014. The DTA “Base Format”: A TEI Subset for the Compilation of a Large Reference Corpus of Printed Text from Multiple Sources . In: Journal of the Text Encoding Initiative 8.
- Geyken, Alexander; Haaf, Susanne; Wiegand, Frank. 2012. The DTA ‘base format’: A TEI-Subset for the Compilation of Interoperable Corpora . In: Schriftenreihe der Österreichischen Gesellschaft für Artificial Intelligence KONVENS 2012 5. Hrsg. von Jeremy Jancsary. Wien, S. 383–391.
- Haaf, Susanne; Schulz, Matthias. 2014. Historical Newspapers & Journals for the DTA. In: Proceedings of the 9th LREC – LRT4HDA workshop, 26.–31.5.2014 9th LREC – LRT4HDA workshop,. Hrsg. von Nicoletta Calzolari. Reykjavik, S. 50-54.