Inhalt:
|
Können
Computer übersetzen?
Einblick in die Möglichkeiten der Computeranwendung beim Übersetzen Können Computer übersetzen? Man könnte die Frage beantworten wie das berühmte „Radio Eriwan“: „Im Prinzip nein, aber es wird immer wieder versucht“. Sprache ist die große Intelligenzleistung des Menschen. Sie unterscheidet ihn von allen anderen Großsäugetieren auf diesem Planeten. Sie ist ein Wunder, das zu verstehen uns bisher nicht gelungen ist. Wie könnten wir es künstlich nachahmen? Denken Sie jetzt einmal kurz darüber nach, was Sprache Ihnen bedeutet, was Sie Ihnen ermöglicht. Ohne die Sprache wäre es Ihnen nicht möglich gewesen zu lernen. Sie könnten weder Ihre Gedanken noch Ihre Gefühle kommunizieren, geschweige denn sie aufzeichnen und anderen hinterlassen. Was geschieht, wenn Sie ein spannendes Buch lesen? Aus den niedergeschriebenen Wörtern entsteht durch sog. „Subvokalisation“ Sprache, die Sie „hören“ können, obwohl Sie wahrscheinlich keinen Laut hervorbringen und nicht einmal Ihre Lippen bewegen. Während Sie sich in die Geschichte vertiefen, vergessen Sie, wo Sie sich gerade befinden. Bilder erscheinen vor Ihren Augen. Sie hören Laute, nehmen Gerüche wahr, die mit der Geschichte zu tun haben. Wenn das Buch sehr gut ist, sind Sie auf einmal Teil der Handlung und übernehmen eine der Rollen. Doch in Wirklichkeit sitzen Sie immer noch im Wohnzimmer auf dem Sofa. Haben Sie Kinder? Dann können Sie sich vielleicht noch daran erinnern, wie Ihr Kind begann, erste einzelne Wörter zu Sätzen zu formen. In der relativ kurzen Zeit von 2 bis 3 Jahren lernte es eine komplette Sprache zu sprechen, mit all ihren grammatischen Formen und einem beträchtlichen Wortschatz. Wenn Sie viel mit ihm gesprochen oder ihm gar vorgelesen haben, hat Ihr Kind möglicherweise schon mit vier oder fünf Jahren eine bemerkenswerte Sprachgewandtheit erreicht. Es kann formenreich, mit fein der jeweiligen Situation angepaßter Modulation, seine Wünsche mitteilen, Erlebtes erzählen, widersprechen, Zuneigung oder Angst und Besorgnis ausdrücken. Warum Computer als Übersetzer nichts taugen Und dann ist da Ihr PC, ein grauer Kasten unter dem Schreibtisch. Hat er Ihnen schon einmal „seine“ Gedanken oder Gefühle mitgeteilt? Absurd! Denn Computer besitzen keinerlei Intelligenz. Sie haben keine Gedanken und schon gar keine Gefühle. Sie sind einfach nur Maschinen, deren Fähigkeiten in etwa dem Gehirn einer Schnecke entsprechen. Dennoch neigen wir dazu, Ihre Fähigkeiten weit zu überschätzen, weil wir damit heute beeindruckende Dinge tun. Ein Beispiel: Der Computerwissenschaftler und -kritiker Joseph Weizenbaum entwickelte bereits in den späten 1970er Jahren ein Computerprogramm namens Eliza, mit dem Menschen über Tastatur und Bildschirm „Gespräche“ führen konnten. Eliza übernahm dabei die Aufgabe eines Psychoanalytikers. Das Programm spielte seine Rolle so gut, dass einige Testpersonen sich von Eliza regelrecht „verstanden“ fühlten. Weizenbaum bewies damit seine Ausgangsannahme: Wenn die Antworten eines Computers vernünftig erscheinen, neigt der Mensch allzu schnell dazu, dem Computer mehr Verständnis zuzuschreiben, als er tatsächlich hat. In Wirklichkeit „verstand“ Eliza weder die Fragen, noch seine eigenen Antworten. Es handelte sich einfach um ein heuristisches System, das Intelligenz überzeugend vorgaukelte. (Mehr darüber können Sie in Weizenbaums Buch „Die Macht der Computer und die Ohnmacht der Vernunft“ lesen). Menschen können sprechen, lesen und Gelesenes verstehen. Einige können sogar von einer Sprache in eine andere übersetzen. Computer aber können nicht verstehen. Wie könnten sie daher das Übersetzen beherrschen? Es ist unmöglich, einen Text in letzter Konsequenz korrekt zu übersetzen, ohne ihn zu verstehen. Deshalb können Computer nicht übersetzen, jedenfalls nicht im Sinn des Wortes. In Darstellungen dessen, was Computer als „Übersetzer“ zu leisten vermögen wird regelmäßig der gleiche Fehler wiederholt: Die Komplexität und Einzigartigkeit der menschlichen Sprache wird für selbstverständlich genommen und unterschätzt. Selbst „einfache“ Sprache ist voller Mehrdeutigkeiten. Betrachten Sie nur den folgenden Satz und überlegen Sie kurz, welche vielfältigen Interpretrationsmöglichkeiten er bietet: Der Mann sah die Kuh mit dem Fernglas auf der Wiese. Wir erkennen die Fallgruben in diesem Satz und interpretrieren die Aussage wahrscheinlich zumindest teilweise korrekt. Dafür steht uns sog. „Weltwissen“ zur Verfügung, z. B. wissen wir, dass eine Kuh normalerweise kein Fernglas hat. Darüber hinaus können wir den Kontext des Satzes oder Abschnitts mit in Betracht ziehen und so die verbleibenden Unklarheiten aufklären, z. B. die Frage, ob der Mann auf der Wiese steht oder die Kuh oder beide. All das ist dem Computer fast vollständig unmöglich; denn es handelt sich um intelligente Denkprozesse. Um Computer dennoch für die Sprachverarbeitung einsetzen zu können, hat man den Versuch unternommen, die Sprache auf einzelne Sätze zu reduzieren und diese nach mathematischen Regeln zu analysieren und beim Übersetzen auf die gleiche Art und Weise zu synthetisieren. Dazu muss man dem Computer ein umfangreiches Regelwerk und einen möglichst umfassenden Wortschatz zur Verfügung stellen. Trotz jahrzehntelanger Anstrengungen hat dies letztlich nicht zu befriedigenden Ergebnissen bei der maschinellen Übersetzung von Text geführt. Warum nicht? Weil der entscheidende Faktor nicht integriert werden kann: das Textverständnis. Solange Computer Texte nicht wirklich verstehen können, eignen sie sich nicht als Übersetzer. Würden Sie einen Menschen ausgestattet mit einigen guten Wörterbüchern und hochbegabt in zwei Sprachen Fachtexte übersetzen lassen, die er inhaltlich nicht versteht? Hoffentlich nicht! Warum sollten wir dann Computern solche Aufgaben anvertrauen? Behalten Sie diese Grundüberlegungen im Sinn, während ich Ihnen nun einen Überblick darüber zu geben versuche, welche Hilfestellung Computer beim Übersetzen tatsächlich bieten können. Drei Kategorien von Übersetzungswerkzeugen Im Grunde genommen gibt es heute drei Kategorien von computergestützten Übersetzungswerkzeugen:
Terminologieverwaltungs-Systeme sind Datenbanksysteme, die speziell an die Verwaltung von Terminologie angepasst wurden. Die meisten dieser Systeme bieten eine Anzahl vordefinierter Felder für die typischen Einträge: Begriff, Genus, Wortart, Sachgebiet, Definition, Synonym, usw. Bei den professionellen Systemen ist der Eintragsvielfalt praktisch keine Grenze gesetzt. Auch Synonyme und Alternativeinträge können mit den gleichen Informationen verwaltet werden wie Haupteinträge. Mehrsprachige Datenerfassung ist fast immer möglich. Zwischen Einträgen können automatische und manuelle Verknüpfungen hergestellt werden. Terminologie korrekt zu erfassen ist eine aufwändige Detailarbeit,
deren Früchte nur mittelfristig geerntet werden können. Umso
wichtiger ist es daher, ein offenes System auszuwählen und sorgfältig
darauf zu achten, dass elementare Grundsätze der Datenverarbeitung
beachtet werden. Die Datenbanklösung sollte das nicht ver- oder behindern.
Drei Grundsätze sind für die Systemauswahl und den Einsatz entscheidend. Nur wenn sie beachtet werden, ist der wachsende Datenbestand flexibel nutzbar, kann systematisch aufgeteilt und vielfältig erschlossen werden.
Ein gravierender Fehler beim Einsatz von TVS ist, dass oft zuviele Begriffe eingetragen werden. Stolz geben einige Firmen an, dass Ihre Terminologiedatenbank 5000 und mehr Einträge enthält. Ein großer Teil davon sind lange zusammengesetzte Wörter wie „Gegendruckwalzenantrieb“, „Einzugswalzenantrieb, „Tafelquerausrichtungsrolle“ usw. Das Erfassen solcher Zusammensetzung führt zur „Explosion“ des Terminologiebestandes und häufig zu neuen Inkonsistenzen. Statt die Wörter „Gegendruckwalzenantrieb“ und „Einzugswalzenantrieb“ zu erfassen, wäre es besser, „Antrieb“, „Gegendruckwalze“ und „Einzugswalze“ zu erfassen und dann in den Texten kleinere Einheiten durchgängig zu verwenden, z. B. „Antrieb der Gegendruckwalze“ und „Antrieb der Einzugswalze“. Da die Wörter „Antrieb“, „Gegendruckwalze“ und „Einzugswalze“ im Text ohnehin noch an anderen Stellen benötigten werden, spart man so mindestens zwei Einträge und vermeidet die Gefahr von Inkonsistenz. Ein anderer Fehler ist der oft zu breite Ansatz. Mancher will gleich von Anfang an ein „richtiges“ Wörterbuch aufbauen und zwingt die Benutzer, für jeden Begriff zahlreiche Details einzutragen und eine Definition zu schreiben. Das führt dazu, dass der Bestand nur langsam anwächst und kaum praktische Bedeutung erlangt. Die Folge ist, dass die Arbeit wieder aufgegeben wird, bevor der Nutzen geerntet werden kann. Da der Terminologiebestand jederzeit nachgearbeitet werden kann, ist es vollkommen in Ordnung, sehr einfach mit Grundeinträgen zu beginnen. Erfassen Sie anfänglich nur:
Wichtig ist jedoch, ein paar Eintragsregeln schriftlich zu fixieren und allen beteiligten mitzuteilen, damit Inkonsistenz bei den Einträgen von vornherein vermieden werden kann. Lassen Sie sich bei der Ausarbeitung solcher Richtlinien von einem erfahrenen Übersetzer oder Terminologen beraten. Translation-Memory-Systeme (TMS) Die Grundidee des Translation-Memories (Übersetzungsspeichers) ist die Wiederverwendung von bereits vorhandenen Übersetzungen. Während der Übersetzungsarbeit werden Ausgangstext und Übersetzung in Form von Satzpaaren gespeichert. Der entstehende Datenbestand kann beim nächsten Übersetzungsprojekt zunächst auf bereits vorhandene Sätze abgefragt werden, die dann automatisch in die Übersetzung aufgenommen werden. Voraussetzungen für sinnvollen Einsatz Der Einsatz von TMS ist logischerweise nur sinnvoll, wenn die zu übersetzenden Texte einen gewissen Anteil an Wiederholung enthalten. Bei aufeinanderfolgenden Versionen oder Varianten von technischen Dokumentationen ist das der Fall. Doch selbst bei nur 10 bis 15 % Wiederholung lohnt sich der Einsatz noch, denn der Einsatz von professionellen TMS reduziert den Aufwand für die Endformatierung der Dokumente nach dem Übersetzen erheblich. Professionelle Formatierung erforderlich Eine weitere Voraussetzung ist die professionelle Formatierung der Ausgangstexte. Die Sätze dürfen nicht durch erzwungene Zeilenumbrüche oder gar Absatzendemarken unterbrochen werden. Auch zahlreiche andere Formatierungszeichen stören TMS, z. B. Tabulatoren, Fontwechsel, Bild- und Referenzanker, Indexeinträge usw. Da deren Position im gespeicherten übersetzten Satz und im neu zu übersetzenden Satz variieren kann, würden zwei ansonsten identische Sätze nicht als identisch erkannt. Doch mit vielen dieser Probleme kommen die aufwändigen Filter der erhältlichen Systeme inzwischen recht gut zurecht. Viele Firmen haben mit dem TMS-Einsatz schon in kurzer Zeit beträchtliche Einsparungen erzielt. Über die damit verbundene Begeisterung wird jedoch oft eine generelle Gefahr des TMS-Einsatzes übersehen. Kein Satz „lebt“ für sich allein. Seine Bedeutung ist vom umgebenden Text (Kontext) abhängig. Somit kann es erforderlich sein, ein und denselben Satz in zwei verschiedenen Kontexten unterschiedlich zu übersetzen. Der Automatismus des TMS verhindert das jedoch. So kann es zu falschen Übersetzungen kommen. Dazu ein Beispiel. Ein namhafter Hersteller von Bahngetrieben stellt im wesentlichen zwei Getriebetypen her: Turbinengetriebe für Diesellokomotiven und Radsatzgetriebe für E-Loks. Wenn in Dokumentationen für Turbinengetriebe vom „Motor“ die Rede ist, ist ein Dieselmotor gemeint, beim Radsatzgetriebe ein Elektromotor. Im deutschen Ausgangstext muss nicht unbedingt ein sprachlicher Unterschied zwischen den Produkten gemacht werden. Die Wörter „Motor“ und „Getriebe“ passen für beide Produkte. Doch in Englisch gilt es die Unterschiede im Text herauszustellen: Dieselmotor = engine, Elektromotor = motor; Turbogetriebe = turbo transmission, Radsatzgetriebe = axle gearbox. Bei der Erstübersetzung einer Anleitung für ein Turbinengetriebe entsteht nun beispielsweise folgendes Satzpaar im TMS:
Im Markt existieren zwei konkurrierende Konzepte von TMS:
![]() Schematische Darstellung der Funktion von "Transit", STAR AG Fazit Der Computereinsatz im Übersetzungsbüro ist heute Alltag geworden. Leider werden die Möglichkeiten jedoch vielerorts überschätzt. Läßt man TMS-Systeme ohne Aufsicht werkeln, sammeln sich mit der Zeit zahlreiche Fehler an, die an automatisch vorübersetzte Dokument weitervererbt werden. Behalten Sie beim Einsatz jedes CAT-Werkzeugs deshalb immer die Antwort
von Radio Eriwan im Sinn: Computer können nicht übersetzen, weil
Sie Text weder lesen noch verstehen können.
Matthias
Schulz
ProfiServices GmbH Kreuzhalde 4 73453 Abtsgmünd Fon: (0 73 66)/91 91 80 Fax: (0 73 66)/91 91 82 eMail: mas@profiservices.de |