Home Previous Zeitschrift 2002/06 Next Index
 
  Inhalt:
 
 
 
Einblick in die Möglichkeiten der Computeranwendung beim Übersetzen
Was uns die Sprache bedeutet
Warum Computer als Übersetzer nichts taugen
Drei Kategorien von Übersetzungswerkzeugen
Terminologieverwaltungs-Systeme (TVS)
Entscheidende Grundsätze für Auswahl und Einsatz
Fehler beim Einsatz
Translation-Memory-Systeme (TMS)
Voraussetzungen für sinnvollen Einsatz
Professionelle Formatierung erforderlich
Gefahren beim Einsatz von TMS
Zwei konkurrierende Konzepte
Fazit
Autor

 

Können Computer übersetzen?

Einblick in die Möglichkeiten der Computeranwendung beim Übersetzen

Können Computer übersetzen? Man könnte die Frage beantworten wie das berühmte „Radio Eriwan“: „Im Prinzip nein, aber es wird immer wieder versucht“. Sprache ist die große Intelligenzleistung des Menschen. Sie unterscheidet ihn von allen anderen Großsäugetieren auf diesem Planeten. Sie ist ein Wunder, das zu verstehen uns bisher nicht gelungen ist. Wie könnten wir es künstlich nachahmen?

Was uns die Sprache bedeutet

Denken Sie jetzt einmal kurz darüber nach, was Sprache Ihnen bedeutet, was Sie Ihnen ermöglicht. Ohne die Sprache wäre es Ihnen nicht möglich gewesen zu lernen. Sie könnten weder Ihre Gedanken noch Ihre Gefühle kommunizieren, geschweige denn sie aufzeichnen und anderen hinterlassen.

Was geschieht, wenn Sie ein spannendes Buch lesen? Aus den niedergeschriebenen Wörtern entsteht durch sog. „Subvokalisation“ Sprache, die Sie „hören“ können, obwohl Sie wahrscheinlich keinen Laut hervorbringen und nicht einmal Ihre Lippen bewegen. Während Sie sich in die Geschichte vertiefen, vergessen Sie, wo Sie sich gerade befinden. Bilder erscheinen vor Ihren Augen. Sie hören Laute, nehmen Gerüche wahr, die mit der Geschichte zu tun haben. Wenn das Buch sehr gut ist, sind Sie auf einmal Teil der Handlung und übernehmen eine der Rollen. Doch in Wirklichkeit sitzen Sie immer noch im Wohnzimmer auf dem Sofa.

Haben Sie Kinder? Dann können Sie sich vielleicht noch daran erinnern, wie Ihr Kind begann, erste einzelne Wörter zu Sätzen zu formen. In der relativ kurzen Zeit von 2 bis 3 Jahren lernte es eine komplette Sprache zu sprechen, mit all ihren grammatischen Formen und einem beträchtlichen Wortschatz. Wenn Sie viel mit ihm gesprochen oder ihm gar vorgelesen haben, hat Ihr Kind möglicherweise schon mit vier oder fünf Jahren eine bemerkenswerte Sprachgewandtheit erreicht. Es kann formenreich, mit fein der jeweiligen Situation angepaßter Modulation, seine Wünsche mitteilen, Erlebtes erzählen, widersprechen, Zuneigung oder Angst und Besorgnis ausdrücken.

Warum Computer als Übersetzer nichts taugen

Und dann ist da Ihr PC, ein grauer Kasten unter dem Schreibtisch. Hat er Ihnen schon einmal „seine“ Gedanken oder Gefühle mitgeteilt? Absurd! Denn Computer besitzen keinerlei Intelligenz. Sie haben keine Gedanken und schon gar keine Gefühle. Sie sind einfach nur Maschinen, deren Fähigkeiten in etwa dem Gehirn einer Schnecke entsprechen. Dennoch neigen wir dazu, Ihre Fähigkeiten weit zu überschätzen, weil wir damit heute beeindruckende Dinge tun. Ein Beispiel: Der Computerwissenschaftler und -kritiker Joseph Weizenbaum entwickelte bereits in den späten 1970er Jahren ein Computerprogramm namens Eliza, mit dem Menschen über Tastatur und Bildschirm „Gespräche“ führen konnten. Eliza übernahm dabei die Aufgabe eines Psychoanalytikers. Das Programm spielte seine Rolle so gut, dass einige Testpersonen sich von Eliza regelrecht „verstanden“ fühlten. Weizenbaum bewies damit seine Ausgangsannahme: Wenn die Antworten eines Computers vernünftig erscheinen, neigt der Mensch allzu schnell dazu, dem Computer mehr Verständnis zuzuschreiben, als er tatsächlich hat. In Wirklichkeit „verstand“ Eliza weder die Fragen, noch seine eigenen Antworten. Es handelte sich einfach um ein heuristisches System, das Intelligenz überzeugend vorgaukelte. (Mehr darüber können Sie in Weizenbaums Buch „Die Macht der Computer und die Ohnmacht der Vernunft“ lesen).

Menschen können sprechen, lesen und Gelesenes verstehen. Einige können sogar von einer Sprache in eine andere übersetzen. Computer aber können nicht verstehen. Wie könnten sie daher das Übersetzen beherrschen? Es ist unmöglich, einen Text in letzter Konsequenz korrekt zu übersetzen, ohne ihn zu verstehen. Deshalb können Computer nicht übersetzen, jedenfalls nicht im Sinn des Wortes.

In Darstellungen dessen, was Computer als „Übersetzer“ zu leisten vermögen wird regelmäßig der gleiche Fehler wiederholt: Die Komplexität und Einzigartigkeit der menschlichen Sprache wird für selbstverständlich genommen und unterschätzt. Selbst „einfache“ Sprache ist voller Mehrdeutigkeiten. Betrachten Sie nur den folgenden Satz und überlegen Sie kurz, welche vielfältigen Interpretrationsmöglichkeiten er bietet:

Der Mann sah die Kuh mit dem Fernglas auf der Wiese.

Wir erkennen die Fallgruben in diesem Satz und interpretrieren die Aussage wahrscheinlich zumindest teilweise korrekt. Dafür steht uns sog. „Weltwissen“ zur Verfügung, z. B. wissen wir, dass eine Kuh normalerweise kein Fernglas hat. Darüber hinaus können wir den Kontext des Satzes oder Abschnitts mit in Betracht ziehen und so die verbleibenden Unklarheiten aufklären, z. B. die Frage, ob der Mann auf der Wiese steht oder die Kuh oder beide.

All das ist dem Computer fast vollständig unmöglich; denn es handelt sich um intelligente Denkprozesse. Um Computer dennoch für die Sprachverarbeitung einsetzen zu können, hat man den Versuch unternommen, die Sprache auf einzelne Sätze zu reduzieren und diese nach mathematischen Regeln zu analysieren und beim Übersetzen auf die gleiche Art und Weise zu synthetisieren. Dazu muss man dem Computer ein umfangreiches Regelwerk und einen möglichst umfassenden Wortschatz zur Verfügung stellen. Trotz jahrzehntelanger Anstrengungen hat dies letztlich nicht zu befriedigenden Ergebnissen bei der maschinellen Übersetzung von Text geführt. Warum nicht? Weil der entscheidende Faktor nicht integriert werden kann: das Textverständnis. Solange Computer Texte nicht wirklich verstehen können, eignen sie sich nicht als Übersetzer. Würden Sie einen Menschen ausgestattet mit einigen guten Wörterbüchern und hochbegabt in zwei Sprachen Fachtexte übersetzen lassen, die er inhaltlich nicht versteht? Hoffentlich nicht! Warum sollten wir dann Computern solche Aufgaben anvertrauen?

Behalten Sie diese Grundüberlegungen im Sinn, während ich Ihnen nun einen Überblick darüber zu geben versuche, welche Hilfestellung Computer beim Übersetzen tatsächlich bieten können.

Drei Kategorien von Übersetzungswerkzeugen

Im Grunde genommen gibt es heute drei Kategorien von computergestützten Übersetzungswerkzeugen:

  • Terminologieverwaltungs-Systeme (TVS), die Wörter ein- oder mehrsprachig verwalten und Übersetzer bei der Wortwahl unterstützen;
  • Translation-Memory-Systeme (TMS), die Texte vergleichen und vorhandene Übersetzungen wieder verwenden;
  • maschinelle Übersetzungssysteme (MÜ), die Texte vollständig autark zu übersetzen versuchen. Darüber soll in diesem Artikel nichts weiter ausgeführt werden, weil die praktische Bedeutung von MÜ-Systemen zu Recht sehr gering ist.
Terminologieverwaltungs-Systeme (TVS)

Terminologieverwaltungs-Systeme sind Datenbanksysteme, die speziell an die Verwaltung von Terminologie angepasst wurden. Die meisten dieser Systeme bieten eine Anzahl vordefinierter Felder für die typischen Einträge: Begriff, Genus, Wortart, Sachgebiet, Definition, Synonym, usw. Bei den professionellen Systemen ist der Eintragsvielfalt praktisch keine Grenze gesetzt. Auch Synonyme und Alternativeinträge können mit den gleichen Informationen verwaltet werden wie Haupteinträge. Mehrsprachige Datenerfassung ist fast immer möglich. Zwischen Einträgen können automatische und manuelle Verknüpfungen hergestellt werden.

Terminologie korrekt zu erfassen ist eine aufwändige Detailarbeit, deren Früchte nur mittelfristig geerntet werden können. Umso wichtiger ist es daher, ein offenes System auszuwählen und sorgfältig darauf zu achten, dass elementare Grundsätze der Datenverarbeitung beachtet werden. Die Datenbanklösung sollte das nicht ver- oder behindern. 

Entscheidende Grundsätze für Auswahl und Einsatz

Drei Grundsätze sind für die Systemauswahl und den Einsatz entscheidend. Nur wenn sie beachtet werden, ist der wachsende Datenbestand flexibel nutzbar, kann systematisch aufgeteilt und vielfältig erschlossen werden.

  1. Der Terminologiebestand sollte in den hauptsächlich zum Schreiben von Texten und Dokumentationen verwendeten Programmen verfügbar sein. Ideal ist eine Schnittstelle, die sowohl den Abruf der Terminologiedatenbank als auch deren Erweiterung von diesen Programmen aus ermöglicht. Für Übersetzer sollte das Terminologie-verwaltungs- System in ihre Arbeitsoberfläche so integriert sein, dass es Übersetzungen erfasster Wörter automatisch anbietet.
  2. Jedes Feld der Datenbank sollte nur für einen einzigen Datentyp verwendet werden, z. B. sollte nicht im gleichen Feld das Sachgebiet und die Quelle des Begriffes eingegeben werden (sog. „Elementarität“).
  3. Die Datenbank sollte eine möglichst feine Unterscheidung der einzelnen Datentypen ermöglichen, z. B. statt eines Feldes „Grammatik“ sollte es Felder wie „Wortart“, „Geschlecht“ geben (sog. „Granularität“).
Fehler beim Einsatz

Ein gravierender Fehler beim Einsatz von TVS ist, dass oft zuviele Begriffe eingetragen werden. Stolz geben einige Firmen an, dass Ihre Terminologiedatenbank 5000 und mehr Einträge enthält. Ein großer Teil davon sind lange zusammengesetzte Wörter wie „Gegendruckwalzenantrieb“, „Einzugswalzenantrieb, „Tafelquerausrichtungsrolle“ usw. Das Erfassen solcher Zusammensetzung führt zur „Explosion“ des Terminologiebestandes und häufig zu neuen Inkonsistenzen.

Statt die Wörter „Gegendruckwalzenantrieb“ und „Einzugswalzenantrieb“ zu erfassen, wäre es besser, „Antrieb“, „Gegendruckwalze“ und „Einzugswalze“ zu erfassen und dann in den Texten kleinere Einheiten durchgängig zu verwenden, z. B. „Antrieb der Gegendruckwalze“ und „Antrieb der Einzugswalze“. Da die Wörter „Antrieb“, „Gegendruckwalze“ und „Einzugswalze“ im Text ohnehin noch an anderen Stellen benötigten werden, spart man so mindestens zwei Einträge und vermeidet die Gefahr von Inkonsistenz.

Ein anderer Fehler ist der oft zu breite Ansatz. Mancher will gleich von Anfang an ein „richtiges“ Wörterbuch aufbauen und zwingt die Benutzer, für jeden Begriff zahlreiche Details einzutragen und eine Definition zu schreiben. Das führt dazu, dass der Bestand nur langsam anwächst und kaum praktische Bedeutung erlangt. Die Folge ist, dass die Arbeit wieder aufgegeben wird, bevor der Nutzen geerntet werden kann.

Da der Terminologiebestand jederzeit nachgearbeitet werden kann, ist es vollkommen in Ordnung, sehr einfach mit Grundeinträgen zu beginnen. Erfassen Sie anfänglich nur:

  • den Begriff in mindestens zwei Sprachen
  • die Wortart
  • das grammatische Geschlecht
  • das Sachgebiet, zu dem der Begriff gehört
Wer anfänglich nicht mehr fordert, motiviert gerade die Übersetzer, viele Einträge zu machen, so dass sich der Nutzen der Datenbank rasch einstellt.

Wichtig ist jedoch, ein paar Eintragsregeln schriftlich zu fixieren und allen beteiligten mitzuteilen, damit Inkonsistenz bei den Einträgen von vornherein vermieden werden kann. Lassen Sie sich bei der Ausarbeitung solcher Richtlinien von einem erfahrenen Übersetzer oder Terminologen beraten.

Translation-Memory-Systeme (TMS)

Die Grundidee des Translation-Memories (Übersetzungsspeichers) ist die Wiederverwendung von bereits vorhandenen Übersetzungen. Während der Übersetzungsarbeit werden Ausgangstext und Übersetzung in Form von Satzpaaren gespeichert. Der entstehende Datenbestand kann beim nächsten Übersetzungsprojekt zunächst auf bereits vorhandene Sätze abgefragt werden, die dann automatisch in die Übersetzung aufgenommen werden.

Voraussetzungen für sinnvollen Einsatz

Der Einsatz von TMS ist logischerweise nur sinnvoll, wenn die zu übersetzenden Texte einen gewissen Anteil an Wiederholung enthalten. Bei aufeinanderfolgenden Versionen oder Varianten von technischen Dokumentationen ist das der Fall. Doch selbst bei nur 10 bis 15 % Wiederholung lohnt sich der Einsatz noch, denn der Einsatz von professionellen TMS reduziert den Aufwand für die Endformatierung der Dokumente nach dem Übersetzen erheblich.

Professionelle Formatierung erforderlich

Eine weitere Voraussetzung ist die professionelle Formatierung der Ausgangstexte. Die Sätze dürfen nicht durch erzwungene Zeilenumbrüche oder gar Absatzendemarken unterbrochen werden. Auch zahlreiche andere Formatierungszeichen stören TMS, z. B. Tabulatoren, Fontwechsel, Bild- und Referenzanker, Indexeinträge usw. Da deren Position im gespeicherten übersetzten Satz und im neu zu übersetzenden Satz variieren kann, würden zwei ansonsten identische Sätze nicht als identisch erkannt. Doch mit vielen dieser Probleme kommen die aufwändigen Filter der erhältlichen Systeme inzwischen recht gut zurecht.

Gefahren beim Einsatz von TMS

Viele Firmen haben mit dem TMS-Einsatz schon in kurzer Zeit beträchtliche Einsparungen erzielt. Über die damit verbundene Begeisterung wird jedoch oft eine generelle Gefahr des TMS-Einsatzes übersehen. Kein Satz „lebt“ für sich allein. Seine Bedeutung ist vom umgebenden Text (Kontext) abhängig. Somit kann es erforderlich sein, ein und denselben Satz in zwei verschiedenen Kontexten unterschiedlich zu übersetzen. Der Automatismus des TMS verhindert das jedoch. So kann es zu falschen Übersetzungen kommen. Dazu ein Beispiel.

Ein namhafter Hersteller von Bahngetrieben stellt im wesentlichen zwei Getriebetypen her: Turbinengetriebe für Diesellokomotiven und Radsatzgetriebe für E-Loks. Wenn in Dokumentationen für Turbinengetriebe vom „Motor“ die Rede ist, ist ein Dieselmotor gemeint, beim Radsatzgetriebe ein Elektromotor.

Im deutschen Ausgangstext muss nicht unbedingt ein sprachlicher Unterschied zwischen den Produkten gemacht werden. Die Wörter „Motor“ und „Getriebe“ passen für beide Produkte. Doch in Englisch gilt es die Unterschiede im Text herauszustellen: Dieselmotor = engine, Elektromotor = motor; Turbogetriebe = turbo transmission, Radsatzgetriebe = axle gearbox.

Bei der Erstübersetzung einer Anleitung für ein Turbinengetriebe entsteht nun beispielsweise folgendes Satzpaar im TMS:

  • Deutsch: Verbinden Sie Motor und Getriebe.
  • Englisch: Connect engine and transmission.
Diese Übersetzung passt nur für das Turbinengetriebe. Beim Radsatzgetriebe müsste die korrekte Übersetzung für den exakt gleichen Satz lauten:
  • Englisch: Connect motor and gearbox.
Solche Differenzen können in TMS-Systemen im allgemeinen nicht ohne weiteres verwaltet werden. Außerdem können die Unterschiede viel subtiler sein. Gefahr droht hier vor allem bei Sätzen, die einen Rückbezug auf den vorausgehenden Satz enthalten oder aus einer Aufzählung mehrerer Unterpunkte stammen. Das Problem liegt darin begründet, dass TMS einzelne Sätze aus ihrem Kontext herauslösen und in anderen Kontexten wieder verwenden. Bei den allermeisten Systemen ist der Kontext, aus dem ein Satz stammt, nach der Speicherung im Translation-Memory nicht mehr nachvollziehbar. Das Translation- Memory kann allenfalls mit einem Schlagwort noch einem bestimmten Sachgebiet zugeordnet werden. Nur ein einziges Translation- Memory-System macht davon eine Ausnahme: Transit von Star. Es funktioniert grundlegend anders als die anderen Systeme.

Zwei konkurrierende Konzepte

Im Markt existieren zwei konkurrierende Konzepte von TMS:

  • Kontext unabhängiges System, das mit einer Datenbank arbeitet und die Satzpaare ähnlich wie ein Terminologie-Verwaltungssystem speichert. Grob vereinfacht könnte man sagen, es handele sich um „Terminologie-Verwaltungssystem für Sätze“.

    Dieser TMS-Typ birgt immer die Gefahr falscher Übersetzungen, weil jeder Satz für sich allein behandelt und vom Kontext losgelöst wird. Diese Gefahr kann durch sehr sorgfältigen Einsatz vermieden werden. Doch die Erfahrung zeigt, dass die Anwender im Einsatz immer unvorsichtiger werden, weil der Einsparungsgedanke dominiert.

    Ein weiterer Nachteil ist das auf Dauer gigantische Datenvolumen der TM-Datenbank. 100 MByte und mehr sind durchaus möglich. Solche Datenbanken sind kaum per Datenübertragung zu transportieren und tendentiell instabil. Die Reparatur defekter binärkodierter Datenbestände ist praktisch unmöglich.

    Allerdings gibt es auch einen Vorteil: Ein Satz wird immer gleich übersetzt. Es gibt keine „Doubletten“.

  • Kontext abhängiges System (einziger Vertreter: Transit von Star), das mit Paaren von Referenzdateien (sog. „Sprachpaaren“) arbeitet. Hierbei ist das Translation-Memory nicht in einer Datenbank gespeichert, sondern in den relativ kleinen Arbeitsdateien des TMS (meist weit unter 500 kByte). Die Arbeitsdateien enthalten jeweils den gesamten übersetzten Text. Jeder Satz im Ausgangstext wird einem Satz im Zieltext durch eine Nummer zugeordnet. Jeder Satz bleibt somit in seinem spezifischen Kontext. Das Translation-Memory kann gezielt für die Übersetzungsaufgabe ausgewählt und zusammengestellt werden.

    Ein weiterer Vorteil ist das Format der Arbeitsdateien: XML. Die Dateien können mit jedem XML-Editor geöffnet werden. Fehler und Beschädigungen können leicht repariert werden, ohne dass der wertvolle Translation-Memory-Bestand verlorengeht.

    Allerdings gibt es auch Nachteile: Ein und der gleiche Satz kann unterschiedlich übersetzt werden, und zwar auch dann, wenn das nicht erforderlich ist. Es entsteht also mit der Zeit eine beträchtliche Datenredundanz, die externe Verwaltung des Bestandes erforderlich macht.
Summa summarum: TMS-Einsatz ist sehr lohnend, aber Vorsicht ist angebracht.
  

Schematische Darstellung der Funktion von "Transit", STAR AG


Fazit

Der Computereinsatz im Übersetzungsbüro ist heute Alltag geworden. Leider werden die Möglichkeiten jedoch vielerorts überschätzt. Läßt man TMS-Systeme ohne Aufsicht werkeln, sammeln sich mit der Zeit zahlreiche Fehler an, die an automatisch vorübersetzte Dokument weitervererbt werden.

Behalten Sie beim Einsatz jedes CAT-Werkzeugs deshalb immer die Antwort von Radio Eriwan im Sinn: Computer können nicht übersetzen, weil Sie Text weder lesen noch verstehen können. 
 
 

Matthias Schulz
ProfiServices GmbH
Kreuzhalde 4
73453 Abtsgmünd
Fon: (0 73 66)/91 91 80
Fax: (0 73 66)/91 91 82
eMail: mas@profiservices.de

 
Zum Seitenanfang
 

© ADOLPH Verlag GmbH - Letztes Update 27.05.2003