Kollektive Intelligenz: Kann KI Literatur?

von André Hansen


Im Frühsommer 2022 entsteht auf der Jahrestagung des Berufsverbands der Literaturübersetzerinnen und Literaturübersetzer in Wolfenbüttel die Idee zu einem Projekt über Übersetzungsmaschinen, die auf Künstlicher Intelligenz beruhen. Der Zeitdruck in der Branche wird immer größer, und warum sollte, was beim Fachübersetzen üblich ist, nicht auch beim Übersetzen von Büchern eine Rolle spielen? Künstliche Intelligenz in der Literatur − allein der Gedanke ist schon verpönt, oder? Je älter die Wolfenbütteler Tage werden, desto bereitwilliger berichten Jüngere, die Unterhaltungsromane übersetzen, aber auch Altgediente, die sich mit tiefsinnigen Sachbüchern beschäftigen, von ihrer Arbeit mit DeepL. Es sei eine Hilfestellung, es gehe schon schneller. Doch im gleichen Atemzug auch: »Auf den Text hatte ich eh keine Lust. Da kommt es nicht so auf Qualität an.«

Plötzlich steht die Frage im Raum: Kann KI Literatur?

Dank der großzügigen Förderung des Deutschen Übersetzerfonds e. V. im Rahmen des Programms »Neustart Kultur« aus Mitteln der Beauftragten der Bundesregierung für Kultur und Medien sowie der logistischen Unterstützung des Kulturwerks Berliner Schriftstellerinnen und Schriftsteller e. V. können Andreas G. Förster, Heide Franck und André Hansen dieser Frage auf den Grund gehen und Experimente mit DeepL koordinieren. Ein wichtiges Ziel ist die Aufklärung über Möglichkeiten und Grenzen der aktuellen Maschinenübersetzungssysteme. Oder um das englische Schlagwort dafür zu verwenden: Machine Translation Literacy.

Vierzehn Kolleg*innen erklären sich bereit, sechs verschiedene Workflows zu erproben, von der einfachen Nachbearbeitung von Maschinenübersetzungen bis zum Einsatz von Fachübersetzertechnik wie CAT-Tools (Computer-Assisted Translation).

 

Beeinflussend, ermüdend und im Weg

Ist der Siegeszug von DeepL und Co. unaufhaltsam? Werden die Programme unausweichlicher Bestandteil der Arbeit von literarisch Sprachmittelnden sein? Die Studie zeigt ein durchwachsenes Bild. Wir sehen, dass im Jahr 2023 Maschinenübersetzungssysteme nicht leistungsfähig genug zu sein scheinen, um Literaturübersetzer*innen bei ihrer Aufgabe in einem signifikanten Maße weiterzuhelfen.

Zusammenfassend lassen sich aus den Erfahrungsberichten drei wesentliche Effekte des Einsatzes von Maschinenübersetzungssystemen festhalten:

1. Priming Effect oder Vorprägungseffekt

Beim Einsatz von DeepL und Co. werden Übersetzer*innen durch die Ausgabe der Maschine vorgeprägt. Das äußert sich in zweierlei Hinsicht. Einerseits wird zu wenig geändert: Unpassende, ungelenke Formulierungen bleiben stehen. Andererseits besteht bei manchen Kolleg*innen der Wunsch, sich von der Maschinenvorlage abzuheben, obwohl der Output angemessen ist. Vielleicht wäre man ohne den Maschinen-Output auf eine ähnliche Version gekommen. Hier muss ständig eine Balance gefunden werden. Was darf wirklich geändert werden? Was ist zwingend anzupassen? Das verlangt eine besondere Anstrengung und lenkt vom Ausgangstext ab.

2. Fatigue Effect oder Ermüdungseffekt

Generell erfordert die Arbeit mit Maschinenübersetzungssystemen wohl eine größere Konzentration. Maschinenübersetzungssysteme wie DeepL oder Google Translate sind unzuverlässig. Besonders auffällig ist, dass sie andere Fehler machen als übersetzende Menschen. Das Post-Editieren, also das Bearbeiten eines Maschinen-Outputs, ist insofern auch nicht mit einem Übersetzungslektorat zu vergleichen. Beim Übersetzungslektorat geht es wie beim Übersetzen selbst im Wesentlichen um einen »Problemtext«, das Original. Menschliche Fehler in der Übersetzung lassen sich auf Lücken in der Sprachkenntnis, Unkenntnis kultureller Besonderheiten oder andere Missverständnisse zurückführen, die für Menschen aber in der Regel nachvollziehbar sind. Eine Übersetzungsmaschine kann in einem Satz eine richtige Entscheidung treffen, und im nächsten Satz steht sie vor demselben Problem und entscheidet falsch. Die Aufmerksamkeit richtet sich beim Post-Editing also auf zwei »Problemtexte«, das Original und die maschinelle Vorübersetzung.

Die KI-gestützten Übersetzungssysteme weisen auf ihre teils erratische Vorgehensweise auch nicht hin, sondern präsentieren ihr Ergebnis als ein fertiges Produkt. Sie sind dem Anschein nach keine Hilfsmittel für berufstätige Übersetzer*innen, sondern geben sich als deren Ersatz aus.

3. Obstacle Effect oder Hinderniseffekt

So lassen sich auch bestimmte Fehler erklären, die Maschinen eigentlich nicht machen dürften, insbesondere falsche Anführungszeichen oder fehlerhafte Umrechnungen von feet in Meter etc. Die Industrie verspricht, dass KI die langweiligen, repetitiven Aufgaben übernehme und den (kreativ) arbeitenden Menschen nur noch anspruchsvolle Arbeiten überlasse. Das sieht bei der x-ten Korrektur von falsch umgerechneten Damenschuhgrößen leider anders aus.

Nicht nur aus diesem Grund stellt der Maschinen-Output ein Hindernis zum Originaltext dar. Effizienter wäre ein Arbeiten mit der Maschinenübersetzung nur, wenn der Originaltext nicht mehr gründlich geprüft werden müsste. Dann geht aber die Verbindung zur ursprünglichen Intention verloren und auch das tatsächliche Verstehen des Ausgangstexts. Durch die KI-Vorlage wird es schwieriger, den Ausgangstext zu verinnerlichen und ihn mit der eigenen Kreativität in der Zielsprache neu zu schreiben. Darin besteht aber die Arbeit von literarisch Übersetzenden.

 

Versuchsanordnungen

Die Arbeit mit der Maschine kam den meisten Beteiligten ermüdend, qualitätsgefährdend und weniger interessant vor. Literaturübersetzer*innen wollen der Verantwortung gegenüber »ihren« Autor*innen gerecht werden. Schließlich werden ihnen Werke anvertraut, an denen teils jahrelang mühevoll gearbeitet wurde. Im Versuchsaufbau der Studie wurden zwei Texte bearbeitet, immer mit DeepL: ein Auszug aus dem Liebesroman Meet Me in the Margins von Melissa Ferguson und ein Auszug aus dem Sachbuch What We Don’t Talk About When We Talk About Fat von Aubrey Gordon. Für jeden der sechs Workflows wurden Paare aus fiction und nonfiction gebildet. Für den jeweils anderen Text haben die Teilnehmer*innen eine Review verfasst und die Erfahrungen der anderen Person kommentiert. Dabei sind ganz konkrete Fragen zum Text, aber auch allgemeinere Überlegungen zum Wesen des Übersetzens ans Licht gekommen.

Workflow 1: Das einfache Lektorat

Können wir auf das Original auch einfach verzichten? Schließlich ist es gerade bei kleineren Sprachen oft schwer, Fachkräfte zu finden, die Zeit haben, diesen oder jenen Titel binnen zwei Monaten rasch noch dazwischenzuschieben. Wie wäre es also, das Original völlig zu ignorieren und der Maschinenübersetzung blind zu vertrauen?

  • Else Laudan hat Freude am kreativen Redigieren und findet die Maschinenfassung ansatzweise brauchbar.
  • Carlotta Herland versucht sich immer wieder den Originaltext vorzustellen und findet diese Arbeitsweise anstrengender als eine einfache Übersetzung.

Workflow 2: Wörterbuch DeepL

Wenn man nicht weiterweiß, kommt oft das Wörterbuch ins Spiel (oder eine Suchmaschine oder eine Online-Enzyklopädie oder eine Kollegin vom Übersetzerstammtisch oder oder). DeepL liegt eine KI zugrunde, die sehr viele Kontextdaten gespeichert hat und vielleicht den passenden Begriff besser bereitstellt als ein klassisches Diktionär.

  • Alexandra Rak fühlt sich von teilweise absurden Übersetzungsvarianten abgelenkt.
  • Für Ursula Wulfekamp kommt ein Arbeitsschritt hinzu, der das Nachschlagen in seriösen Wörterbüchern jedoch nicht ersetzt.

Workflow 3: Post-Editing in Word

Eine praktisch vielleicht sehr relevante Aufgabenstellung ist das »Lektorieren« einer maschinell hergestellten Übersetzung. Das Wort steht in Anführungszeichen, weil für das Bearbeiten von Maschinen-Output andere Kompetenzen erforderlich sind als für das Lektorieren einer menschlich angefertigten Übersetzung. Doch es ist nicht weit hergeholt, dass Verlage sich proprietäre Übersetzungsmaschinen programmieren lassen, um eine Vorübersetzung zu generieren, die den Verlagsansprüchen näher kommt als ein Generalist wie DeepL.

  • Katharina Meyer beobachtet einen Verlust von Stil, denn sie kann der maschinengenerierten Semantik und Syntax nichts abgewinnen.
  • Nina Restemeier muss etlichen Fallstricken ausweichen und sehr aufpassen, nicht in die Falle der Maschine zu tappen.

Workflow 4: Post-Editing in DeepL

Einige typische Fehlerquellen von KI-generierten Übersetzungen, etwa die uneinheitliche formelle oder informelle Ansprache, behebt DeepL in seinem Web-Interface und in seiner App. Es könnte sich also lohnen, direkt in der Oberfläche zu arbeiten und dort vorgeschlagene Synonyme auszuwählen, um zu einem besseren Ergebnis zu kommen.

Workflow 5: Post-Editing in DeepL mit Glossarfunktion

Doch DeepL kann ja noch mehr! Für diese Versuchsanordnung sollten die beiden Teilnehmerinnen zunächst ein Glossar mit wichtigen Begriffen aus den Ausgangstexten erstellen, dieses in die DeepL-Glossarfunktion hochladen und die dann erzeugte Übersetzung in der Programmoberfläche selbst bearbeiten.

  • Eine Teilnehmerin war recht angetan von dieser Arbeitsweise und sieht in der Automatisierung von Übersetzungsarbeit die Zukunft.
  • Heike Reissig beschreibt ihre Erfahrungen mit diesem Workflow hingegen deutlich kritischer.

Workflow 6: CAT-Tool mit Glossar und DeepL-Plug-in

Auch in dieser sehr komplexen Versuchsanordnung haben die Teilnehmer*innen zunächst ein Glossar erstellt, dieses dann aber in ein CAT-Tool ihrer Wahl (Trados Studio, memoQ, Wordfast) integriert. Dort kam dann auch das Plug-in des Maschinenübersetzungsanbieters ins Spiel. CAT-Tools segmentieren den Ausgangstext in Sätze oder kleinere Einheiten. Mehrfach vorkommende Segmente können so leichter wiedergefunden werden, aber der Blick für den ganzen Absatz, das ganze Kapitel könnte verdeckt werden. Dieser Aufgabe haben sich gleich vier Personen gestellt:

Die Erfahrungsberichte sollen einen Überblick über den Stand der Technik beim literarischen Übersetzen liefern. Sie sind ein Diskussionsangebot an Kolleg*innen und die Branche. Aktuell sind Vorteile des Einsatzes von Maschinenübersetzungssystemen nur in Einzelfällen zu beobachten. KI-Technik ist also noch kein Pflichtbestandteil der Arbeit von Literaturübersetzer*innen wie etwa andere technische Entwicklungen (Textverarbeitungsprogramme oder Rechtschreibkorrektur). Wichtig scheint daher, dass Übersetzer*innen autonom und kompetent darüber entscheiden können, welche Technik sie einsetzen. Machine Translation Literacy ist aber auch eine Fähigkeit, die den Beruf anspruchsvoller macht.

Das bedeutet allerdings: Die Honorare müssen steigen.

 

Bild: your123