Maschinenübersetzungen und der menschliche Faktor

Bei Maschinenübersetzungen ist der menschliche Faktor von wesentlicher Bedeutung. Bei automatisierten Übersetzungen kommt es immer wieder zu Übelsetzungen. Davon war in diesem Blog schon die Schreibe.

Falsche Freunde gebt es nicht nur bei Maschinenübersetzungen

Es passiert immer wieder. Schnell ist aus einem ähnlich klingenden Wort der Quellsprache ein Wort der Zielsprache geworden. Den Klassiker dazu mit dem Gast, der Servicekraft, dem Steak und der Paarung become / bekommen, spare ich mir. Die einen nennen es [Übelsetzung]1, wenn es aus dem professionellen Bereich stammt.
Denn wer Übersetzung als Lebensgrundlage hat, dem wird übelgenommen, über so.
Für andere ist es einfach ein falscher Freund.

Falscher Freund … ist ein Begriff aus der Interlinguistik und bezeichnet Wortpaare aus verschiedenen Sprachen, die sich äußerlich stark ähneln, aber in ihren jeweiligen Sprachen eine unterschiedliche Bedeutung haben. –Wikipedia

Glücklicherweise gibt es Listen über falsche Freunde der Sprachkunst. Dieser unübersehbaren Anzahl von Listen wird hier keine neue hinzugefügt. Die Menge an Listen zeigt jedoch, wie notwendig dieses Wissen ist.

Im Alltäglichen schleicht sich eben ab und an ein Lapsus ein. Erschreckend wirkt das, wenn gesellschaftlich exponierte Personen in die Falle treten. Auch Computer sind davor nicht gefeit. Da Computer in allem viel schneller sind, können sie auch Fehler viel schneller erzeugen und rascher verbreiten.

Computer sind großartig. Mit ihnen macht man die Fehler viel schneller. ―Bert Sutherland

Falsche Freunde durch Maschinenübersetzungen

Übersetzungen durch Maschinen erleichtern tägliche Kommunikation. Gleichzeitig gibt es Abweichungen, die auf den ersten Blick nicht erklärbar sind. Unter bestimmten Umständen werden aus der Geschlechtsangabe divers die Pluralform von Taucher. Bei VUITest sind sie die Ursachen ausführlicher beschrieben.

Die Verbindung von einem Wort zum anderen zwischen unterschiedlichen Sprachen ist nicht kongruent.
Wörter der einen Sprache haben je nach Kontext und Abstufung unterschiedliche äquivalente Entsprechungen.
Im Forum von Leo wird unter der Überschrift Übelsetzungen ab 7/2021 im Beitrag 45 von cassandra auf folgende Abweichung bei der Übersetzung aus dem Spanischen hingewiesen.

… Übersetzung von mamá y papá = Brust und Papst …

Formal ist die Übersetzung zutreffend.
Da Computer jedoch – zumindest in diesem Fall – keinerlei Kontext berücksichtigen, wird die korrekte Übersetzung "Mama und Papa" außen vor gelassen.

Maschinenübersetzungen und der menschliche Faktor

Der menschliche Faktor besteht bei Übersetzungen besteht in Sprachkompetenz, die in erster Linie durch Sozialisation entsteht. Zu dieser Sozialisation gehört auch die Wahrnehmung von Kontext. Zwar sind Computer sehr schnell, es fehlt ihnen jedoch im Alltag die Fähigkeit, Kontext zu erkennen.

Vermutlich ist die Erkennung von Kontext bei der Softwareerstellung zu kostspielig.

Maschinenübersetzungen bei Mehrsprachigkeit

Im Februar 2022 berichtet der SPIEGEL, dass Twitter Nutzer sperrt, nachdem das dortige System den deutschen Artikel die als Mordaufruf gewertet hatte. Damit Hassrede ausgeblendet wird, hatte der Übersetzungsalgorithmus den Tweet als englisch eingeschätzt und das Konto gleich gesperrt.

Algorithmen können Mehrsprachigkeit nicht erkennen, das war dem Testteam im Sprachlabor auch aufgefallen, als Sprachassistenten geprüft wurden. Damals hatte ein Sprachpartikel mit fehlerhaftem Imperativ zu englischen Suchergebnissen geführt.

Ähnlich war es, als im Praxistest von Sprachassistenten Bilder angezeigt werden sollten, deren deutsches Wort auch im Englischen vorhanden ist.

Dieses Verhalten – das wir bei VUITest als multilinguale Homographen oder Homonyme nennen und das bei leo.org als "falsche Feinde" bezeichnet wird, kann bei der Bildsuche nur mühselig umgangen werden. Es entsteht, weil die Schreibweise von Wörtern in unterschiedlichen Sprachen gleich ist, aber die Semantik sich unterscheidet. Eine kurze Liste dieser Wörter ist weiter unten zu sehen.

Schreibweise Bedeutungen
hose Schlauch (en), Kleidungsstück (de)
rock Kleidungsstück (de), Gestein (en),
Musikstil (int.)
taste Teil von Instrumenten (de), schmecken (en)
stadium Sportstätte (en), Entwicklungsabschnitt (de)
addition Rechenart (de), kaufm. Rechnung (fr)
plane Folie (de), Flugzeug (en)

Diese Homographen machen es bei etlichen Suchmaschinen unmöglich nach deutschen Wörtern zu suchen, die Gegenstände beschreiben. Bei nichtgegenständlichen Begriffen ist es ohnehin schon ungleich schwerer Bilder dazu zu finden.

An anderer Stelle wurde bereits erwähnt, dass nichtsprachliche Informationen nur schlecht zu übersetzen sind. Vgl. Vom übersetzen: nichtsprachliche Informationen übertragen

Maschinenübersetzungen – Lektorat als menschlicher Faktor

Maschinenübersetzungen sind für sprachliche Feinheiten ungeeignet

Die Krönung von Maschinenübersetzungen ist es, wenn Texte über sprachliche Eigenschaften maschinell übersetzt werden und Beispiele von Homonymen gleich mit übersetzt werden. Dies passiert Greelane sowohl für deutsch als auch für französisch. Der Text ist auch in andere Sprachen übersetzt worden.

Maschinenübersetzungen ohne menschliche Prüfung sind aus meiner Sicht derzeit für professionelle Tätigkeit nicht empfehlenswert und mangelhaft. Allenfalls tragen sie zur Erstellung von Thesauri oder als Rohübersetzung zur Beschleunigung sprachmittelnder Tätigkeiten bei.

Redaktion ist auch für die Übertragung bildlicher Inhalte erforderlich

Bei der Globalisierung von Webseiten wird sehr oft nur die Bedienungsschicht in Betracht gezogen. Das führt dann zur Darstellung unzutreffender Bilder mit verschiedenen Sprachen. Ein klassisches Beispiel ist das Wort hose, das im Deutschen ein Beinkleidungsstück beschreibt, im Englischen einen Schlauch und regional auch Fußballstutzen und historisch auch Strumpfhosen der frühen Neuzeit. Die Erwartung ist, auf einer englischen Seite einen Schlauch als Bild angezeigt zu bekommen, auf einer deutschen Seite Bekleidungsstücke und auf anderen Sprachen nichts.

Die Darstellung ist zwar unterschiedlich, mal wird das Bekleidungsstück, mal der Schlauch angezeigt. Dies ist bei nahezu allen Anbietern für alle genutzten Sprachen dann aber identisch, dabei sind die kommerziellen Anbieter und sehr wenige öffentlich zugängliche Suchdienste Ausnahmen.

Gesellschaftlich determinierte Inhalte sind zu lektorieren

Unterschiedliche Rechtsnormen

Rechtliche Texte werden auf Webseiten sehr oft unlektoriert übernommen. Dabei wird außer Acht gelassen, dass Gesetze nicht immer weltweit gelten, sondern für einen bestimmten politischen Bereich verabschiedet wurden. "Begrenzte Garantie" als Übertragung der "limeted warranty" wird oft ins Deutsche übersetzt. Eine Übersicht der Rechtsnormen in Deutschland zeigt die Seite eRecht24. Gleichzeitig wäre zu prüfen, ob einfache Übersetzungen in eine andere Sprache auch rechtlich bindend sind.

Wer Webseiten aus anderen Ländern aufmerksam untersucht, findet dort sehr selten eine Angabe über Ansprechpersonen. In einigen Ländern ist sogar die Angabe einer Anschrift sehr rar gesät. Wer bei einer ins Englische übersetzte Seite auf ein Impressum stößt, hat bestimmt eine europäische Firma vor sich. Bei der Globalisierung sind die unterschiedlichen Rechtsauffassungen und -verständnisee ebenfalls zu berücksichtigen.

Abweichende Maßeinheiten

Maßeinheiten sind aus europäischer Sicht metrisch oder angloamerikanisch oder imperial. Den beiden letztgenannten liegen Einheiten wie Fuß, Zoll, Meilen, Pfund, Acker (acres) oder Gallonen zugrunde. Wer für einen Telekommunikationsunternehmen die amerikanischen Angaben über den Luftstrom eines Servers aus Kubikfuß in Kubikmeter umgerechnet hat, versteht, die dabei entstehende Irritation.
Auch vor Ingenieuren der Raumfahrt machen Umrechnungsfehler nicht Halt. Der Absturz der Ariane 5 ist dafür ein Beleg, wie die TU Darmstadt darstellt: "Verrechnet" Sendereihe im Deutschlandfunk von Frank Grotelüschen – TU Darmstadt.

Wenn es zu Rechenfehlern kommt, wenn die Maßeinheit bekannt ist, ist die Übersetzung von Zahlenwerten ohne Berücksichtigung der Messeinheit als Kontext schon beinahe gesundheitsschädigend. Die Griffkraft von erwachsenen Menschen beträgt zwischen 300 – 500 Newton (N), das entspricht etwa 30 – 50 Kilogram (kg). Wer auf die Seite eines internationalen Anbieters über die Messung der Griffkraft trifft, findet dort die Werte von 57 – 105. Hier fehlt die Ma0einheit und es ist nur zu vermuten, dass Pfund gemeint ist. Aufmerksamen Lektoren wäre es nicht entgangen, dass der gesellschaftliche Rahmen eine andere Maßeinheit impliziert. Über die abweichende Selbstwahrnehmung bei Personen, die sich im Internet über Gesundheitsfragen informieren, kann nur spekuliert werden.

Übersetzung von Text innerhalb von Bildern

Ausgehend von der eben erwähnten Seite ergibt sich als kurze Anmerkung, dass die Beschriftungen innerhalb der Bilder fast niemals übersetzt werden.

Zusammenfassung: Maschinenübersetzungen und der menschliche Faktor

Maschinenübersetzungen sind nicht zwangsweise fehlerhaft. Die Wahrscheinlichkeit einen fehlerhaften Text in der Zielsprache zu erhalten, nimmt mit steigender Textmenge zu und ist abhängig vom Sprachstil, dem Sprachbereich und der Spezialisierung der eingesetzten Sprache.

Weil es keine kongruente Äquivalenz von Wörtern zwischen Sprachen gibt, sind Abschnitte mit Wörtern, die mehrere Bedeutungen in der Zielsprache haben, ausführlich zu lektorieren.

Computer berücksichtigen den Kontext eines Textes nur unzureichend. Dadurch entstehen Abweichungen in der Zielsprache. Das betrifft bildliche Darstellungen, fehlende Kontexte bei Maßeinheiten und Beschreibungen sprachlicher Inhalte. Für sprachliche Übersetzungen sind besondere Lektorate erforderlich, da gerade Beispiele von Sprachkonstrukten oder Sprachfeinheiten nicht kongruent und im Buchstabensinne übersetzt werden können.

Homographen in einer Zielsprache erschweren wegen des unberücksichtigten Kontextes die zielgenaue Übertragung von Texten. Da die Algorithmen nur selten in der Lage sind, Sprachgrenzen treffsicher zu ermitteln, steigt dadurch die Übersetzungsungenauigkeit.


27.4.22 Ergänzung Maßeinheiten und Bedienschicht, Umstellungen der Zusammenfassung


  1. Die Kategorisierung als "Übelsetzung" ist kein Lapsus, sondern bewusst, weil Sprache dadurch nicht besser wird. Erfunden wurde es im Forum von leo.org. 

 242 Aufrufe

Bildquellen

  • Übersetzen mit zwei Augen: Pixabay

Verwandte Beiträge

sds29
  • sds29
  • S Dahms mag Wörter und unterstützt seit 2021 das Testteam der Speech & Phone GmbH und das Redaktionsteam.

3 Pingbacks

Kommentarfunktion ist geschlossen.

-+=