Geistes- und Kulturwissenschaften entschlüsseln ihre jahrhundertealten Quellen, die Bibliotheken, Archive und Museen als Gedächtnisinstitutionen bewahren, traditionell mit Methoden und Erkenntnissen der Historischen Grundwissenschaften, wie beispielsweise der Paläographie. Ein Ergebnis der digitalen Transformation, in die die Digitalisierung des schriftlichen Kulturerbes seit dem Beginn des 2. Jahrtausends mündete, ist die Entwicklung und der Einsatz von KI-gestützten Technologien für die automatische Transkription digitalisierter Quellen.
Zielt HTR (handwritten text recognition) auf die Transkription von Handschriften, so hat OCR (optical character recognition) die Transkription gedruckter Schriftdokumente zum Gegenstand. Gegenwärtig werden unterschiedliche Programme entwickelt, unter denen Transkribus für HTR, Tesseract für OCR bereits gute Ergebnisse erzielen.
In Baden-Württemberg bündelt das Kompetenzzentrum OCR-BW an den Universitätsbibliotheken Mannheim und Tübingen die Expertise auf dem Feld der KI-gestützten Texterkennung. Die Universitätsbibliothek Freiburg kooperiert mit OCR-BW und hält Anteile in der Genossenschaft, die Transkribus entwickelt. Sofern in Forschungs- oder Lehrprojekten, für die Drittmittel beantragt werden, Transkribus-Credits benötigt werden, können besondere Konditionen aus der Mitgliedschaft der Universitätsbibliothek geltend gemacht werden.
Aus Mitteln des Digital Humanities Labs an der Philologischen Fakultät bietet die UB in begrenztem Umfang kostenlose Transkribus-Credits für Vorhaben in Forschung und Lehre. Falls Sie diese in Anspruch nehmen wollen, füllen Sie bitte das folgende Formular aus. Nach kurzer Prüfung Ihres Antrags werden die beantragten Credits auf Ihrem Transkribus-Account verbucht.