Besser übersetzen mit KI?
Im bvik Trendbarometer Industriekommunikation 2019 stimmen 53 % der Befragten zu, dass Chatbots in naher Zukunft einen Teil der B2B-Kundenkommunikation übernehmen werden. Damit bestätigt sich zumindest die Einschätzung der Expertenbefragung von 2018, bei der rund 68 % zugestimmt haben, dass der Einsatz von Künstlicher Intelligenz (KI) die B2B-Kundenkommunikation gravierend verändern wird. Gerade im Bereich “Übersetzung für internationale Zielmärkte” spielt das Thema KI eine besonders wichtige Rolle. Erhöht maschinelle Übersetzung tatsächlich die Schnelligkeit und Produktivität? Verbessern sich Kontrolle und Konsistenz? Spart man damit Kosten? Hier finden Sie Fragen und Antworten zu maschinellen Übersetzungssystemen aus einem Erfahrungsbericht unseres Fördermitglieds Wieners+Wieners GmbH.
Maschinelle Übersetzung ist eine Form der künstlichen Intelligenz, die die Internationalisierung der Unternehmenskommunikation vereinfachen und beschleunigen kann. Hierbei geht die Technologie noch einen Schritt weiter als bei maschinengestützten Übersetzungen mit sogenannten CAT-Tools (CAT: “computer-aided translation”). Neben den Besonderheiten der Übersetzungssysteme, den Leistungsumfängen einzelner Anbieter und den Möglichkeiten der Kombinierung mit CAT-Tools gibt es Faktoren, die man kennen sollte. Wieners+Wieners hat mit einer Vielzahl von Texten die unterschiedlichen Möglichkeiten ausprobiert. Dabei verglichen sie die Ergebnisqualität von drei Textarten. Für manche Zwecke ist eine maschinelle Übersetzung sehr gut geeignet, für andere nicht. Worauf bei der Entscheidung zum Einsatz von “Machine Translation” zu achten ist, haben die Fachexperten in einem Booklet zusammengestellt, das bei Wieners+Wieners kostenfrei heruntergeladen werden kann.
Inhaltsverzeichnis
Übersicht der Übersetzungssysteme
Es gibt drei Arten maschineller Übersetzungssysteme – regelbasierte, statistische und neuronale Systeme, auch häufig “Engines” genannt. Ein regelbasiertes System nutzt Grammatikregeln, Sprachalgorithmen und Wörterbücher (allgemeine Wörterbücher, Fachwörterbücher, Wortlisten) der Ausgangs- und Zielsprache und geht bei der Übersetzung systematisch vor. Ein Fachgebiet kann mittels neuer Korpora (Wörterbücher/Wortlisten) angepasst werden.
Ein statistisches System lernt die Sprache ausgehend von den am häufigsten zusammen vorkommenden Fragmenten, entnommen aus bestehenden Übersetzungen, und übersetzt im Gegensatz zum regelbasierten System nicht nur anhand vorgegebener Regeln. Dafür werden statistische Modelle verwendet, die auf große Mengen bestehender Daten der Ausgangs und Zielsprache zurückgreifen, die eingepflegt werden. Hierbei werden mit verschiedenen Herangehensweisen syntaktische Muster erkannt und berücksichtigt.
Ein neuronales System verwendet künstliche neuronale Netzwerke, um statistische Modelle zu lernen. Zum Verständnis: Regelbasierte und statistische Systeme wenden das Material “nur” an, das man ihnen gibt. Die Quelle der Sprachen ist bei neuronalen Systemen das Internet, sodass die einbezogenen Texte den natürlichen Äußerungen der Menschen folgen. Die bekannten und gängigen Anbieter stellen keine einzelnen Maschinen für beispielsweise UK und US-Englisch oder Schweizer Hochdeutsch zur Verfügung, sondern mischen die Varietäten bei einer Übersetzung. Wie gut die Übersetzungsergebnisse sind, hängt maßgeblich von der zur Verfügung gestellten Textmenge einer Sprache ab. Da ist es vollkommen naheliegend, dass die besten Ergebnisse in der Sprachkombination mit Englisch erzielt werden, da Englisch die im Internet am häufigsten genutzte Sprache ist.
Ein explizites Fazit der Fachleute zu den drei Systemen finden Sie im ausführlichen Erfahrungsbericht.
Regelbasiert, statistisch oder neuronal – gibt es einen Sieger?
Mit allen Systemen lassen sich sehr gute Ergebnisse erzielen – man muss nur den Ausgangstext gut kennen, den Anspruch an das Übersetzungsergebnis definieren und dieses Wissen in die Entscheidung der Systemwahl einfließen lassen. Alle Systeme lieferten bei langen Sätzen, Rechtschreibfehlern im Ausgangstext, mehrdeutigen Aussagen, sehr aktuellen Themen (Beispiel Pressemitteilung: Falschübersetzung “Gelbwesten” [seit Ende Oktober 2018 eine Protestbewegung in Frankreich]) häufig Übersetzungen mit Fehlern. Das begründet sich darin, dass Sprache nicht konsequent logisch ist, sondern viele Ausnahmen enthält und kulturellen Gegebenheiten angepasst werden muss. Greift man nun das Gute an den Systemen auf und kennt deren Schwachstellen, kann man durch die Kombination von Mensch und Maschine insgesamt sehr gute Ergebnisse erzielen. Welche Vorgehensweise die Sprachexperten genau empfehlen, wird im Abschnitt “Kombinationsmöglichkeiten” thematisiert.
Neuronale maschinelle Übersetzung – ja oder nein?
Sechs wichtige Fragen
1. In welche Sprache(n) soll übersetzt werden?
Die Möglichkeiten der Sprachkombinationen sind bei maschineller Übersetzung begrenzt. Nach den Erfahrungen von Wieners+Wieners funktioniert unter Beachtung bestimmter Voraussetzungen beispielsweise das Sprachpaar Englisch/Deutsch sehr gut. Jede Engine gilt nur für ein Sprachpaar und funktioniert in nur eine Richtung, d. h., eine Engine für Übersetzungen aus dem Englischen ins Deutsche kann nicht für Übersetzungen aus dem Deutschen ins Englische verwendet werden.
2. Um welche Textart handelt es sich?
Einfachere Übersetzungen (Einzelwörter [z. B. Keywords], kurze Sätze, allgemeinere Themen) lassen sich schnell und überwiegend zuverlässig mit der Maschine übersetzen, wobei wir bei sogenannten Homografen (beispielsweise wäre die Übersetzung »park bench« für »Bank« in einem wirtschaftlichen Text falsch) die inhaltlich korrekte Übersetzung häufig nachbessern mussten. Unter welchen Voraussetzungen die Maschine welche Übersetzung wählt, war nicht nachvollziehbar. Sätze mit mehreren Kommas sowie lange Sätze (> 25 Wörter) wurden in fast allen Texten unverständlich oder aber inhaltlich falsch übersetzt.
Einschätzungen der Experten zu den weiteren vier Fragen “Wie wichtig ist der Datenschutz für den jeweiligen Text?”, “Soll eine Corporate Language auch in der Zielsprache gewahrt werden?”, “Darf der Satzbau durch Pre-Editing vereinfacht werden?” und “Ist Transcreation gewünscht?” lesen Sie im ausführlichen Erfahrungsbericht.
Kombinationsmöglichkeiten und Fazit
Wenn umfangreiche Fachtexte schnell, kreativ und inhaltlich fehlerfrei übersetzt werden sollen, überzeugt nach Meinung der Übersetzungsexperten diese Kombination in folgender Reihenfolge:
1. Pre-Editing
2. MÜ inklusive Einsatz eines CAT-Tools (Glossar und Translation Memory)
3. Post-Editing
Maschinelle Übersetzung allein liefert gute Ergebnisse bei einfacheren Textinhalten (häufig bei E-Mail-Texten oder Newslettern zu sehen). Bei anspruchsvollen Texten mit hoher Qualität im Sinne professioneller Marketing-Kommunikation wird es schon schwieriger. Ab wann sich der Einsatz neuronaler maschineller Übersetzungen lohnt und was sich im Detail hinter den einzelnen Stufen der Übersetzung verbirgt, lesen Sie im Erfahrungsbericht.
Bildquelle: Dagmar Gosejacob, Auge an Hirn