Digitale Edition

Weißbuch

Office-Formate TEI Download PDF Download

Stigler, Johannes; johannes.stigler@uni-graz.at

Microsoft-Office- und Open- bzw. LibreOffice-Applikationen verwenden schon seit geraumer Zeit XML-basierte Datenformate zur Speicherung von Text- und Arbeitsblattdaten. Diese Produkte können daher sehr einfach in Transkriptions- und Editionsworkflows eingesetzt werden. Auch dann, wenn am anderen Ende für eine Digitale Edition ein Dokument gemäß den Konventionen der Text Encoding Initiative (TEI) stehen soll. So ist es z. B. möglich, über eine intelligente Verwendung von Formatvorlagen durch Markieren mit der Maus semantische Annotationen in den Text einzubringen.

Sowohl DOCX als auch ODT sind ISO-zertifizierte Container-Formate auf Basis von XML und können daher von einschlägigen Tools direkt weiterverarbeitet werden. Dateien dieses Formates sind eigentlich ZIP-Archive, die mehrere Dateien mit Text und Formatierungsinformationen in menschenlesbarer Notation enthalten. Oxygen, ein in der Community weit verbreiteter XML-Editor, etwa kann beide Datenformate direkt einlesen. Genauso ist es möglich, Dateien dieser Formate über ein Webservice der TEI-Community (OxGarage) direkt ins TEI-Format zu konvertieren. Aufschlussreiche Informationen zu beiden Office-Formaten finden sich auf einer Seite der Library of Congress.

Literatur:

Zitiervorschlag:

Stigler, Johannes 2021. Office-Formate. In: KONDE Weißbuch. Hrsg. v. Helmut W. Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner im HRSM Projekt "Kompetenznetzwerk Digitale Edition". Aufgerufen am: . Handle: hdl.handle.net/11471/562.50.120. PID: o:konde.120

Metadata:

Hier finden Sie umfangreiche Metadaten; außerdem auch ältere Versionen der Weißbucheinträge: Metadaten

Für diesen Artikel existiert eine ältere Version, die Sie hier einsehen können.