DSD-Blog

Digital Humanities – Textarbeit mit Technologie

Beitrag von

12.02.2019

Während viele Branchen und Disziplinen sich der Digitalisierung stellen müssen, um ihr Fortbestehen zu sichern, können die Geisteswissenschaften von den neuen technologischen Möglichkeiten per se profitieren. Nie zuvor war es möglich, Texte in einem derartigen Umfang zu analysieren und auszuwerten. Am Ende dieses Prozesses stehen neue Erkenntnisse und Interpretationsansätze.

Digital Humanities heißt die neue Strömung in den Geisteswissenschaften, die ausgerechnet von einem italienischen Jesuitenpater angestoßen wurde.

Geisteswissenschaften und Informatik – eine neue Symbiose

Um die Arbeiten von Thomas von Aquin indexieren zu können und dafür nicht seine gesamte verbleibende Lebenszeit opfern zu müssen, schlug Roberto Busa dem Gründer von IBM eine Zusammenarbeit vor, die tatsächlich zu dem heute noch bestehenden Projekt Index Thomisticus geführt hat.

Mit den heutigen Möglichkeiten wird die Schnittstelle zwischen den Geisteswissenschaften und der Informatik erweitert, die es bereits zuvor auch schon gegeben hatte. Durch digitale Verfahren können heute beispielsweise Texte auf ihren Stil hin derart analysiert werden, dass eine relativ eindeutige Zuschreibung der Autorschaft möglich ist.

Identifizierung von Stil dank statistischer Erhebung

So haben Journalisten herausgefunden, dass der unter einem männlichen Pseudonym erschienene Roman „Der Ruf des Kuckucks“ tatsächlich von J.K. Rowling stammt. Funktioniert hat das Ganze zunächst wie mit jeder Datenbank: Je mehr Texte zur Verfügung stehen, desto besser kann das System lernen, welche Stileigenschaften welchen Autoren zuzuordnen sind. Dabei geht es vor allem um die Verwendung kleinerer, häufig vorkommender Wörter wie „bis“ oder „und“. Manuell würde die Zuordnung der Autorschaft auf diese Weise ewig dauern.

Die Statistik wird demnach in den Geisteswissenschaften in Zukunft eine größere Rolle spielen. Mit Verfahren wie dem „Text Mining“ werden neue Dimensionen erschlossen, die Grundlagen für weitere Interpretationsmöglichkeiten liefern. Wichtig ist zu betonen, dass die Verfahren der Digital Humanities die menschliche Arbeit am Text nicht ersetzen können.

Neue historische Spracherkenntnisse

Was mit der Zuordnung der Autorschaft funktioniert, funktioniert auch mit der Analyse von Sprachgebrauch in alten Texten. Hierbei geht es nicht darum zuzuordnen, von wem der Text verfasst wurde, sondern die Verwendung von Wörtern und Redewendungen neu zu erfassen. Dadurch können sich neue Erkenntnisse von Sprachgebrauch und Sprachentwicklung in einem Umfang ergeben, die bisher Angenommenes in Frage stellen.

Dies sind nur einige Beispiele, wie die Digitalisierung den Geisteswissenschaften in Anbetracht der zu bewältigenden Textmengen zur Seite stehen kann. Letztendlich müssen die Ergebnisse aber nach wie vor durch Menschen eingeordnet und kontextualisiert werden, um wertvoll zu sein. (tl)