Die Masse macht's

Grundlagen: Maschinelles Übersetzen

Bislang waren die Erfolge beim automatischen Übersetzen menschlicher Sprache eher bescheiden. Neuen Aufwind versprechen nicht bessere Grammatikmodelle, sondern Statistik und rohe Rechengewalt. Davon profitiert wieder einmal Google.

  1. Grundlagen: Maschinelles Übersetzen
  2. Übersetzungsverfahren
  3. Statistische Verfahren
englisch, deutsch, buch, brief

© PC Magazin

englisch, deutsch, buch, brief

Wenn der Computer übersetzt, hat der Mensch etwas zu lachen. Übersetzungsprogramme liefern manchmal verständliche, selten korrekte und oft lustige Texte. Wer hin und wieder einen Online-Translator zu Rate zieht, muss oft schon bei einfachsten Sätzen schmunzeln. Die CNN-Meldung "Microsoft expects Adobe to file suit" (Microsoft erwartet, dass Adobe einen Prozess anstrengt") übersetzt ein Online-Dolmetscher mit "Microsoft erwartet luftgetrockneten Ziegelstein, um Klage einzuordnen". Solch dadaistische Texte muten mehr oder weniger alle digitalen Übersetzer ihren Nutzern zu. Tatsächlich aber taugt die maschinelle Übersetzung (MÜ) nicht nur zur Belustigung. Zwar ist trotz jahrelanger Forschungsanstrengungen der Mensch als Übersetzer immer noch jedem Programm überlegen. Doch in bestimmten Kontexten, mit entsprechend aufbereiteten Texten und guten Übersetzungsprogrammen wie Systran oder Personal Translator lassen sich zwar keine perfekten, aber doch passable Ergebnisse erzielen.

systran, statistisches übersetzen

© PC Magazin

Die bekannte Übersetzungs-Software Systran integriert in den neueren Versionen regelbasierte und statistische Übersetzungsmethoden.

So berichten Unternehmen, die ihr Geld mit Übersetzungen verdienen, von Kosteneinsparungen um 30 Prozent und mehr, wenn sie ergänzend automatische Übersetzer einsetzen. Diese übernehmen zeitsparend die Rohübersetzung, die die menschlichen Profi-Übersetzer korrigieren und ergänzen. Oft geht es weniger um eine stilistisch geschliffene Übersetzung, sondern um ein grobes Verständnis. So lässt Microsoft viele nicht englischsprachige Internet-Hilfsseiten seiner Knowledge Base maschinell erstellen. Auch bei der EU übernehmen Computer einen großen Teil der Übersetzungsarbeit. Bereits 1976 erwarb die damalige Europäische Gemeinschaft für 300 000 Dollar die Nutzungsrechte an der Übersetzungs-Software Systran und entwickelte diese zu einer speziellen Version namens "EC Systran" weiter. Heute liefert die Software Übersetzungen für 26 Sprachpaare bei einem Ausstoß von mehreren Hunderttausend Seiten pro Jahr und 35% eingesparter Übersetzungszeit. Wie es losging

google translate, internet

© PC Magazin

Passabel übersetzt: Der Vorspann dieses Textes wird von Google Translate nicht fehlerfrei, aber akzeptabel ins Englische übersetzt.

Die Idee, menschliche Sprache mit Computern zu übersetzen, ist so alt, wie die Rechenmaschinen selbst. Antreiber dafür waren vor allem militärische Interessen, der Erfolg der Kryptografie im Zweiten Weltkrieg und das Aufkommen der ersten Computer. Als Geburtsstunde der MÜ gilt das so genannte "Weaver-Memorandum" von 1949, in dem der Mathematiker Warren Weaver die Übersetzung von Sprache durch Computer propagierte. Finanziert vom Pentagon versuchten sich Forscher an der Programmierung der maschinellen Übersetzung. Weaver betrachtete das mechanische Übersetzen als eine Art Codeknacken. Natürliche Sprachen seien letztendlich Zeichenketten, die nur umcodiert werden müssen: In einer Datenbank sollte ein Rechner Wort für Wort nach den Entsprechungen der eingegebenen Vokabeln suchen. Danach ersetzt der Computer die gefundenen Wörter der Quellsprache in der gleichen Reihenfolge durch das entsprechende Wort der Zielsprache. Anschließend werden Satzstellung und Flexion nach den Regeln der Zielsprache angepasst.

transfermetzode, übersetzung

© PC Magazin

Transfermethode: Der grammatikalisch analysierte englische Satz wird mit fünf Regeln ins Französische übersetzt.

Diese ersten Versuche waren völlig unzureichend, da keine wirkliche Analyse des Ausgangstextes erfolgte. Vor allem die Analyse syntaktischer Strukturen wie Nominalgruppen, Prädikatstrukturen und Teilsätze, die semantische Analyse und die Bewältigung von Unterschieden zwischen Ausgangs- und Zielsprache, also die eigentlichen Übersetzungsschwierigkeiten, wie sie von der Humanübersetzung her bekannt sind, war damit nicht in den Griff zu bekommen. 1966 empfahl eine staatliche US-Kommission den Abbruch aller Projekte zur maschinellen Übersetzung, da man keine Chance sah, dass in absehbarer Zeit ein akzeptables Programm erstellt werden könnte. Als Folge davon kam die Forschung für zwei Jahrzehnte nahezu zum Erliegen. Erst mit dem Aufkommen leistungsstarker Computer in den 80er Jahren und Fortschritten in der Sprachwissenschaft und Informatik wurden die Arbeiten an der MÜ wieder aufgenommen.

Mehr zum Thema

Word - Text um Bild
Office-Tipp

In Word 2010 und 2013 gibt es Bilderrahmen mit einer pfiffigen Funktion für das Freistellen von Bildinhalten. Wir zeigen, wie es geht.
Wir zeigen den normgerechten Aufbau bei Briefen mit Microsoft Word.
Anleitung

Ein DIN-gerechter Aufbau erleichtert dem Lesenden die Übersicht. Word bietet dafür mit seinen Vorlagen und Funktionen alle Voraussetzungen.
Excel - Nettoarbeitstage
Office-Tipp

Wir erklären, wie Sie in Excel etwa für eine Arbeits- oder Urlaubsplanung die Wochenenden herausrechnen und die Nettoarbeitstage berechnen.
Kalender synchronisiert auf iPad
Zeit-Management

Kalender auf dem Smartphone, PC und im Web synchronisieren - mit unseren 9 Tipps schaffen Sie genau das. Verpassen Sie keinen Termin mehr!
Outlook - Logo
Office-Tipp

Wir zeigen, wie Sie in Outlook die Kalenderwoche anzeigen lassen können. Unser Office-Tipps sorgt für Durchblick bei der Terminplanung.