Machine Learning, Post-Editing und was es damit auf sich hat

Kosten einsparen und dabei am besten noch die Qualität maximieren, das ist der Wunsch vieler international aufgestellter Unternehmen, doch wie soll das gehen? Um in einem internationalen Markt herauszustechen muss jegliche Dokumentation, individuell an den Kunden angepasst sein. Das bedeutet: Übersetzung der Dokumentation in verschiedene Sprachen, abgestimmt auf die jeweiligen kulturellen Gegebenheiten. Durch technische Fortschritte und aktuelle Trends im Bereich Machine & Deep Learning ist genau dies möglich: Ein Unternehmen kann sich von seinen Konkurrenten absetzen, indem es einwandfreie, kundenorientierte Dokumentation bietet.

Ein kleiner Exkurs ins Machine & Deep Learning

Wie kann das sein, dass eine Maschine fast besser, aber vor allem schneller, übersetzt als ein ausgebildeter Übersetzer? Wie verändert sich dadurch die Zukunft des Übersetzerberufs? Durch die Fortschritte dieser neuen Technologien bildet sich für den Übersetzer ein neuer Aufgabenbereich, es folgt also nur eine – in gewissem Maß – Verschiebung der Aufgaben- und Kompetenzbereiche im Berufsbild des Übersetzers.

Doch wie genau funktioniert Machine Learning eigentlich?

Maschinelle Übersetzungen greifen beim Übersetzungsprozess auf eine lexikalische Datenbank zurück. In dieser Datenbank sind alle in Wörterbüchern vorhandenen Begriffe hinterlegt sowie die jeweiligen grammatikalischen Formen. Das System versucht dabei den Ausgangstext aufzuschlüsseln und die einzelnen Segmente zu übersetzen. Die Maschine kann also auch nur so qualitativ übersetzen wie die Datenbanken, die ihr zugrunde liegen sind.

Und was hat es mit Deep Learning auf sich?

Deep Learning geht noch einen Schritt weiter. Diese Künstliche Intelligenz wird zwar auch noch mit Hilfe der Übersetzungsspeicher (Translation Memories) und übersetzten Dokumenten trainiert, doch zusätzlich kommen noch wesentlich größere Mengen an Trainingsdaten hinzu. Die Maschine versucht also alle möglichen Optionen zu erfassen, um daraus die passende Lösung zu erkennen. Wird ein Fehler begangen, geht die Maschine einen Schritt zurück und wiederholt diesen solange bis sie zum richtigen Ergebnis kommt. Die Technologie des Deep Learnings basiert, wie zum Beispiel bei SYSTRAN, auf komplexen Algorithmen anhand derer die Maschine versucht Regeln aufzustellen, Fehler zu korrigieren und sich selbst zu verbessern und am Ende eine einwandfreie Übersetzung zu generieren.

Beispiel: Die Kinder essen Bananen.

In der unten aufgeführten Grafik sind die einzelnen Kategorien zu sehen, anhand welcher das System die maschinelle Übersetzung aufschlüsselt. Dies scheint auf den ersten Blick ganz logisch und vor allem einfach. Aber Achtung! Gerade wenn es um die Aspekte Morphologie und Semantik geht, kann es ganz schön kniffelig werden. Denn gerade im Übersetzungsbereich wird deutlich wie unterschiedlich die Strukturen von Sprache zu Sprache sein können. Manche Formen unterscheiden sich abhängig von der Anzahl, also ob es 2, 3 oder 4 Kinder sind und manche Wörter stehen an einer ganz anderen Stelle im Satz. Bei dem Versuch auf die Inhalte der Datenbank zurückzugreifen, können sich die unterschiedlichsten Fehler einschleichen. Die Qualität der Übersetzung hängt dementsprechend vom Umfang der zugrundeliegenden Datenbank ab (Sprachen, Textformen, Schreibstile etc.).

Post-Editing

Nun zur neuen Aufgabe des menschlichen Übersetzers: Post-Editing.

Doch was ist eigentlich Post-Editing und worauf muss man achten?

Zunächst zur Begriffserklärung:

Post (Nach) – Editing (Bearbeitung) ist der Prozess bei dem ein maschinell übersetztes Dokument von einem menschlichen Übersetzer korrekturgelesen, überprüft und zu einer finalen, fehlerfreien Version abgeändert wird.

Dabei unterscheidet man zwischen folgenden Arten von Post-Editing:

      a. Light Post-Editing

Bei dieser Art von Post-Editing, hauptsächlich für interne Zwecke genutzt, geht es darum den Arbeitsaufwand so gering wie möglich zu halten und so wenig wie möglich zu korrigieren. Es werden nur signifikante Fehler behoben, welche den Leser am Verständnis und – bei z.B. einer Bedienungsanleitung, der anschließenden Nutzung des Produkts beeinträchtigen. Zu dieser Art von Fehlern gehören auch solche, die rechtliche Konsequenzen nach sich ziehen könnten. Der Text soll nach der Bearbeitung sprachlich korrekt und verständlich für den Leser sein. Gut möglich, dass sich der Text nicht „gut formuliert“ anhört, da von jeglichen stilistischen Änderungen abgesehen wird. Dies ist die schwierigere Form des Post-Editing, da sich die meisten Übersetzer zurückhalten müssen, nur das Nötigste zu korrigieren und den stilistischen Aspekt außer Acht zu lassen.

Zu bearbeitende Aspekte:

  • Tippfehler korrigieren
  • Grammatikfehler korrigieren
  • Unverständliche Sätze teils oder vollständig umschreiben
  • Alternativvorschläge löschen

       b. Full Post-Editing

Die zweite Variante des Post-Editing ist langwieriger und gründlicher und wird daher auch hauptsächlich für den externen Gebrauch verwendet. Selbstverständlich wird auch bei dieser Bearbeitung auf Korrektheit und Verständlichkeit geachtet, zusätzlich spielen die stilistischen Aspekte aber eine wichtige Rolle. Der Text muss nicht nur inhaltlich deutlich und für den Leser nutzbar sein, sondern ist auch auf der sprachlichen Ebene konsistent. Nach dem Bearbeitungsprozess soll sich der Ausgangstext wie ein Originaltext lesen und keinerlei Anzeichen aufweisen, maschinell übersetzt worden zu sein. Der Übersetzer hat die oben genannten Aspekte des Light Post-Editing zu beachten plus:

  • Terminologie mit Termbanken abgleichen und ggf. abändern
  • Zieltext mit Referenztexten vergleichen
  • Kulturelle Gegebenheiten mit einbeziehen
  • Syntaktische Anpassungen gemäß der Zielsprache
  • 100%ige Genauigkeit zwischen Ausgangstext und Zieltext gewährleisten

Die untenstehende Tabelle zeigt den Prozess des Post-Editing beispielhaft an einem Auszug einer Bedienungsanleitung.

  • Rot: Änderungen im Light Post-Editing.
  • Grün: Zusätzliche Änderungen im Full Post-Editing.

Generell gilt jedoch: Nur das korrigieren, was nötig!

 

Achtung: Es soll keine neue Übersetzung entstehen. Wird zu viel bearbeitet, geht die Kosten- und Zeitersparnis verloren. Wie viel und vor allem was genau bearbeitet werden soll, muss im Vorfeld festgelegt werden.

Unsere Lösung: beEfficient

Von Laura Münch Team Assistent in Zusammenarbeit mit Verena-Kristin Bickel bei because Germany KG

Diesen Artikel teilen

Condividi su facebook
Condividi su xing
Condividi su twitter
Condividi su linkedin
Condividi su print
Condividi su email

Lascia un commento