Auflistung nach Schlagwort "TEI"
1 - 2 von 2
Treffer pro Seite
Sortieroptionen
- WorkshopbeitragGenerierung von Trainingsdaten für die Handschrifterkennung aus TEI annotierten Dokumenten – Ein Erfahrungsbericht aus dem EU-Projekt READ(INF-DH-2018, 2018) Bryan, Maximilian; Hodel, Tobias; Philipp, NathanaelZum Trainieren maschineller Lernverfahren zur Erkennung von Handschriften werden Textdaten mit korrespondierenden Bildern benötigt. Die Textdaten liegen häufig im TEI-Format das diverse Möglichkeiten eröffnet, um textuelle und semantische Phänomene auszuzeichnen, weiter können gar eigene Tags oder Auszeichnungsarten eingeführt werden. In diesem Beitrag wird ein im EU-Projekt READ entwickeltes parametrisierbares Tool beschrieben, das mit unterschiedlichen Auszeichnungsstilen in TEI umgehen kann und Textdateien auf Seitenbasis liefert, die zur Zuordnung von Text zu Bilddaten (text-to-image) genutzt werden können und somit zur Aufbereitung von Trainingsdaten für Modelle der Handschriftenerkennung dienen. Die gezeigten Beispiele und Anwendungen stammen alle aus Projekten, die ihre Daten für READ zur Verfügung stellten.
- TextdokumentKrümelmonsters Kochbuch(INFORMATIK 2017, 2017) Luttenberger, Norbert; Zedlitz, Jesper; Knauf, TorstenIn diesem Paper diskutieren wir den Begriff der "domänenspezifischen Edition", d.h. einer Edition, die dem spezifischen Inhalt und nicht der äußeren Form des historischen Texts gerecht wird. Diese Art der digitalen Edition scheint uns insbesondere für Gebrauchstexte angemessen zu sein. Um unser Anliegen zu verdeutlichen, stellen wir es anhand der domänenspezifischen Edition eines historischen Kochbuchs dar. Unser Paper entwickelt schließlich ein Schichtenmodell, in dem die Vorgehensweise bei der domänenspezifischen Edition zusammengefasst wird.