Interview 02.06.2017, 14:47 Uhr

«Es wird sehr grosse Änderungen geben»

Das Institut für Computerlinguistik der Uni Zürich entwickelt maschinelle Übersetzungssyste­me und andere Sprach-Tools. Man macht sich aber auch Gedanken über die Auswirkungen.
Computerlinguistik beschäftigt sich mit der maschinellen Verarbeitung menschlicher Sprache und nutzt dafür künstliche Intelligenz. Zu den bekanntesten Anwendungen gehört die maschinelle Übersetzung (MÜ), die auch ein Forschungsschwerpunkt am Institut für Computerlinguistik der Uni Zürich ist. Annette Rios und Martin Volk berichten über aktuelle Forschungstrends, deren Auswirkungen auf die Gesellschaft und den Nutzern für Unternehmen.

Computerworld: Momentan reden alle von künstlicher Intelligenz, als ob es sich dabei um etwas völlig Neues handeln würde. Haben Sie eine Erklärung dafür? Gab es in letzter Zeit Durchbrüche in der Forschung?

Martin Volk: Die neuronalen Netzwerke – eigentlich schon in den 1980er-Jahren erforscht – haben in den letzten Jahren stark an Bedeutung gewonnen, weil die Rechenleistung jetzt erlaubt, damit vernünftige Dinge anzustellen. Das hat zu deutlichen Verbesserungen in der Bilderkennung, der Erkennung gesprochener Sprache und seit etwa zwei Jahren auch im Bereich der maschinellen Übersetzung geführt. Mit diesen maschinellen Lernverfahren kann man ja alles Mögliche lernen, zum Beispiel auch Handschrifterkennung. Das hat, glaube ich, zum aktuellen KI-Hype geführt.

CW: Auslöser war also nur die Hardware-Verbesserung?

Volk: Nicht nur. Nachdem sich gezeigt hat, dass mit der heutigen Hardware viel möglich ist, gab es eine Reihe von architektonischen Weiterentwicklungen. Dadurch kann man die neuronalen Netzwerke heute besser nutzen und organisieren.

CW: Ihr neues Projekt CoNTra arbeitet ja auch mit neuronalen Netzen.

Volk: Genau. Das Projekt wird vom Schweizer Nationalfonds (SNF) unterstützt und startete am 1. Januar 2017. Wir ver­suchen da, neuronale maschinelle Übersetzungssysteme zu entwickeln und die Technologie zu verbessern.

Annette Rios: CoNTra steht für Rich Contexts in Neural Machine Translation. Im Moment übersetzen automatische Systeme immer noch mehrheitlich Satz für Satz. Wir wollen mehr Kontext aus dem Diskurs oder dem ganzen Dokument berücksichtigen. In der Anfangsphase evaluieren wir hauptsächlich, das heisst, wir bauen Test-Sets für bestimmte Schwierigkeiten, die MÜ-Systeme haben.

Volk: Das grosse Problem bei neuronalen Netzen ist, dass man nicht weiss, wo die Fehler herkommen. Um dem auf die Spur zu kommen, variieren wir möglichst systematisch die Eingaben.

Rios: Zum Beispiel bei der Übersetzung mehrdeutiger Wörter: Das deutsche Wort «Absatz» kann je nach Kontext mit «heel», «paragraph» oder «sales» übersetzt werden. Wir extrahieren also einen Satz, in dem die korrekte Übersetzung «heel» wäre und tauschen das Wort durch «sales» oder «paragraph». Dann testen wir, ob das Modell merkt, dass die Übersetzung falsch ist. Das ist möglich, weil das Modell nicht nur über­setzen, sondern Übersetzungen auch mit einer Punktzahl beurteilen kann. Dieses Vorgehen wenden wir auch auf Pro­nomen und andere Grammatikelemente an.

CW: Wenn also vorher von Schuhen die Rede war, wäre die korrekte Übersetzung «heel».

Volk: Genau. Wobei die Schuhe auch erst nachher vorkommen können. Das Ziel des Projekts ist es herauszufinden, welche Art von Kontext auf welche Weise repräsentiert werden muss, um die Übersetzung zu verbessern. Dazu muss man zuerst herauszufinden, wo ein solches System Probleme hat.

CW: Ist dieser Ansatz komplett neu?

Rios: Neuronale maschinelle Übersetzung gibt es seit zwei bis drei Jahren. Das ist also nichts, was wir selbst erfunden haben.

Volk: Wir beschäftigen uns auch schon länger mit der Frage, inwiefern satzübergreifender Kontext hilft, die Übersetzung zu verbessern – zusammen mit dem IDIAP in Martigny. Erstaunlich dabei ist, dass es gar nicht so viel nützt, wie man intuitiv annehmen würde.

CW: Woran liegt das?

Volk: Oft liefert der Satz für sich allein genug Informationen, um mehrdeutige Wörter oder Pronomen richtig zuzuordnen. Und allein durch Erraten mit statistischen Wahrscheinlichkeiten erreicht man schon recht hohe Trefferquoten. Ausserdem muss man dabei Hintergrundwissen vorübergehend speichern und auch rechtzeitig wieder «vergessen». Wir ver­muten, dass Google Translate nach wie vor jeden Satz isoliert übersetzt. Das geht viel schneller, weil man dadurch jeden Satz an einen anderen Server schicken und so gleichzeitig übersetzen kann. Und noch ein Problem gibt es: Wenn das System einen Fehler macht und sich im nächsten Satz daran «erinnert», übersetzt es unter Umständen auch einen Folgesatz falsch, den es ohne diese Berücksichtigung richtig übersetzt hätte.

Nischenforschung wegen Google

CW: Sie forschen also nun an etwas, von dem Sie wissen, dass es nur wenig nützt?

Volk: Ja, denn wir müssen als Forschungsgruppe eine Nische suchen, die nicht schon von den ganz Grossen wie Google bearbeitet wird. Wir konzentrieren uns dementsprechend auch auf Sprachen, die für die Schweiz besonders wichtig sind, zum Beispiel Deutsch-Französisch-Übersetzungen. Bei Google steht ja hauptsächlich Englisch im Fokus.

CW: Darum wird das Projekt wohl auch vom Nationalfonds unterstützt.

Volk: Das ist beim SNF ein gutes Zusatzargument, aber kein zwingendes Kriterium. Wir haben ein Übersetzungssystem für die Sprachen Spanisch und Quechua untersucht, und das wurde auch vom SNF gesponsert. Ich finde es bemerkenswert und dankenswert, dass der SNF sich auf so etwas einlässt. Es war ja völlig klar, dass dies reine Grundlagenforschung ist und weder wir noch irgendwelche Firmen in der Schweiz damit jemals reich werden können. Quechua hat zwar 10 Millionen Sprecher, aber kaum Schriftliches – es erscheint nicht eine einzige Zeitung in dieser Sprache. Es ging in diesem Projekt auch um die Erhaltung dieser Sprache.

CW: Wie entstehen denn Forschungsprojekte? Oder anders gefragt: Wer entscheidet, in welche Richtung geforscht wird? Welche Rolle spielt die Finanzierung?

Volk: Da spielen mehrere Dinge eine Rolle. Zuerst einmal gibt es eine langfristige Forschungsstrategie. Zum Beispiel haben wir uns bisher immer auf schriftliche Texte beschränkt. Jetzt ist die Phonetik-Forschungsgruppe zu uns gezogen, damit sieht das etwas anders aus. Ein langfristiger Grundsatz ist auch, dass alle unsere Projekte mehrsprachig ausgerichtet sind. Zum Beispiel soll Meinungsanalyse nicht nur auf Deutsch funktionieren. Zum Zweiten orientieren wir uns auch an internationalen Entwicklungen – das beste Beispiel sind hier die neuronalen Netze. Und das dritte Kriterium: Wir müssen bei Forschungsprojekten unsere lokalen Kompetenzen berücksichtigen. Das Projekt mit Quechua haben wir nur deshalb gemacht, weil Annette Quechua kann.

Rios: Das ist übertrieben. (lacht)

Volk: Oder weil sie Kenntnisse in Quechua hat. Kompetenzen kann man sich zwar erarbeiten, aber wir lassen die Finger von Sachen, bei denen sich niemand von uns auskennt. Zum Beispiel hat sich hier nie jemand intensiv mit computerbasiertem Sprachenlernen beschäftigt. Das wäre auch ein Thema der Computerlinguistik, aber das machen wir nicht.

Interesse der Wirtschaft

CW: Mit der Firma Textshuttle bieten Sie ja Sentimentanalyse an, also automatisches Eruieren von Meinungen. Mein Eindruck ist, dass das jedes Unternehmen haben will ...

Volk: ... das wär schön ... (lacht)

CW: Beeinflusst das Interesse der Wirtschaft Ihre Strategie? Die Aussicht, einen Sponsor zu finden?

Volk: Bei einem Teil der Projekte schon. Nur ein kleiner Bruchteil unserer Forschung läuft über Stellen, welche die Uni, also der Kanton, uns finanziert. Für alles andere brauchen wir Geld. Forschungsprojekte an der Uni können durch staat­liche Stellen wie dem SNF oder durch die Wirtschaft gefördert werden. Bei der Wirtschaft ist ein kommerzieller Nutzen zentral. Die Firma Textshuttle, die wir vor ein paar Jahren gegründet haben, ist eine Brücke für den Wissenstransfer in die Wirtschaft. Wir bieten dort maschinelle Übersetzung an, aber auch Beratung, um auf die neusten Entwicklungen aufmerksam zu machen. Wir klären auf Wunsch auch ab, ob sich etwas für eine Firma rentiert.

CW: Viele Firmen wissen ja nicht so recht, wie sie den riesigen Input zum Beispiel auf Facebook oder Twitter auswerten sollen, um rechtzeitig passend reagieren können. Ist Sentiment­analyse dafür geeignet?

Volk: Ja, wir haben diesbezüglich schon mit der Firma Argus kooperiert, die auf Meinungsbeobachtungen spezialisiert ist. Auch mit Microsoft arbeiteten wir mal zusammen. Die Firma Textshuttle war daran bisher aber nicht beteiligt.

CW: Sind Chatbots bei Ihnen auch ein Thema?

Volk: Es gab mal eine Lehrveranstaltung dazu, aber wir beschäftigen uns nur am Rande mit dem Thema. Die Kollegen von der ZHAW sind in dem Bereich viel aktiver.

CW: Trotzdem die Frage: Was macht Ihrer Meinung nach einen guten Chatbot aus?

Volk: Er kann eine grosse Bandbreite von kommunikativen Situationen erkennen und entsprechend reagieren. Er sollte also nicht nur auf Ja-Nein-Fragen und Informationsfragen eingehen, sondern beispielsweise auch auf Small Talk, um das Gespräch am Laufen zu halten. Ausserdem muss er über ein Gesprächsgedächtnis verfügen, damit man sich auf vorherige Fragen beziehen kann. Das klingt nach Standard, aber es gibt etliche Chatbots, die das schlecht oder gar nicht können. Ein wirklich guter Chatbot sollte zudem eine Art Benutzerprofil anlegen. So kann er sich anpassen, je nachdem, ob er zum ersten Mal mit der Person kommuniziert oder nicht.

Gefahren des automatisierten Lernens

CW: Wenn man das Lernen automatisiert, können ja auch unvorhergesehene Dinge eintreten. Wo sehen Sie Gefahren und Risiken?

Volk: Neuronale Netze lernen aus grossen Textmengen, welche Begriffe wie stark zusammengehören. Da kommt zum Beispiel heraus, dass im Deutschen der Abstand zwischen «König» und «Königin» etwa gleich ist wie im Englischen der Abstand zwischen «King» und «Queen». Das ist wunderbar. Es kommt aber auch heraus, dass das Wort «Frau» näher zu «Haushalt» steht als das Wort «Mann», dieses dafür näher beim Wort «Karriere». Das heisst: Vorurteile und Stereotypen oder auch tatsächliche Zustände der Vergangenheit werden reproduziert. Das maschinelle Lernen wirkt quasi gesellschaftserhaltend, und wenn man etwas an der Gesellschaft ändern möchte, muss man schauen, dass man diese Tendenzen durchbricht.

CW: Gibt es weitere Schwierigkeiten?

Volk: Automatisches Lernen verspricht viele Erleichterungen. Aber die Frage ist: Wie viele persönliche Daten müssen wir dafür preisgeben? Das ist natürlich ein sehr generelles Problem. Ein anderer Punkt, der unser Gebiet im Speziellen betrifft: Wenn maschinelle Übersetzung immer besser wird und überall zur Verfügung steht, auch als Speech-to-Speech-Übersetzung: Wer wird dann noch Fremdsprachen lernen? Das könnte zum Hobby einer kleinen Fangemeinde werden. Politiker kommen dann schnell auf die Idee, den gesamten Fremdsprachenunterricht abzuschaffen. Das ist einerseits schade, weil mit dem Sprachenlernen ein sehr grosser Kulturaustausch einhergeht. Man kann aber auch sagen, das werde dadurch ausgeglichen, dass wir dann mit jedem Chinesen fliessend sprechen können. Was dieser Fortschritt genau mit uns macht, wissen wir noch nicht, aber ich glaube, es wird sehr grosse Änderungen geben.

CW: Wenn dereinst ein grosser Teil der Texte maschinell erstellt wird, besteht nicht die Gefahr, dass Regeln für die maschinelle Übersetzung selbst aus maschinellen Texten abgeleitet werden und sich das Ganze verselbstständigt?

Rios: Das ist natürlich ein Problem, und zwar schon heute. Wer ein System mit Texten aus dem Web trainieren will, muss sicherstellen, dass automatische Übersetzungen erkannt und herausgefiltert werden.

Volk: Das ist die rein technologische Sicht. Ganz allgemein wirkt sich computergenerierte Sprache auf die Entwicklung der natürlichen Sprachen aus. Ein simples Beispiel: Wenn ich mit dem Aufzug fahre, sagt die automatische Stimme: «Türe öffnet.» Was eigentlich ein unvollständiger Satz ist. Ich habe das jetzt aber schon so oft gehört, dass ich langsam anfange, es als natürlich zu empfinden. Es ist denkbar, dass die Sprache in Zukunft verarmt, weil der Computer nur bestimmte Formulierungen wählt, die wir immer wieder hören und dann selbst benutzen. Es könnten aber auch neue Variationen entstehen, so wie Jugendsprachen sich heute dieses Computerjargons bedienen und ihn kreativ einsetzen. Die genauen Auswirkungen kennt heute niemand. Es gibt z. B. Leute, die behaupten, dass Spelling Checker konservativ auf die Sprache einwirken. Begründung: Wenn man früher eine neue Schreibweise eigentlich besser fand als die alte, hat man einfach begonnen, sie zu benutzen und so konnte sie sich relativ schnell durchsetzen. Heute erinnert einen der Computer mit dem rot unterkringelten Wort immer daran: Das darfst du nicht benutzen, das ist falsch! Aber die Zeiträume, die wir da überblicken, sind noch zu kurz, um diese Behauptung zu prüfen.

CW: Hat Ihre eigene Arbeit auch konkrete Auswirkungen auf den Sprachgebrauch?

Volk: Wir haben Übersetzungssysteme für Film- und Fernseh­untertitel hergestellt, die im skandinavischen Raum ein­gesetzt werden. Die dänische Untertitlergewerkschaft – die gibt es wirklich – hat sich darauf bei mir beschwert, ich würde die dänische Sprache ruinieren. Die Untertitler kontrollieren zwar das, was unser System produziert, und wenn sie eine seltsame Formulierung das erste Mal sehen, korrigieren sie die auch. Wenn sie das aber zum fünften Mal sehen, finden sie es natürlich und lassen es. So wird es dann im dänischen Fernsehen ausgestrahlt. Und die Anzahl der Personen, die das liest, gerade bei diesen Soap Operas, übersteigt alles andere an Medienkonsum, was es in Dänemark gibt. Daher ist der Vorwurf, mein Einfluss auf die dänische Sprache sei gross und könne destruktiv sein, nicht ganz von der Hand zu weisen. Wir haben die Leute, die das kontrollieren, zwar instruiert: «Wenn ihr seltsame Sachen entdeckt, sagt es uns bitte, wir korrigieren das dann im System.» Aber die arbeiten dermassen unter Zeitdruck, da kommt wenig zurück.

CW: Warum wollen Firmen überhaupt noch Übersetzungssysteme kaufen, wenn es doch Google Translate gibt?

Volk: Ein API von Google kostet auch Geld, und ohne wird es bei grossen Mengen mühsam. Das wichtigste Argument ist aber, dass die Firmen ihre Dokumente nicht an Google übermitteln wollen. Banken, aber teilweise auch Unternehmen aus der Industrie, sagen: «Wir wollen so etwas wie Google Translate, aber auf unseren eigenen Servern. Und sobald wir es haben, sperren wir Google Translate.» Das ist ein wich­tiger Grund, weshalb wir da noch im Geschäft sind.

Tipps für die automatische Übersetzung

Maschinelle Übersetzung funktioniert prinzipiell nicht zwischen allen Sprachen gleich gut. Eine Übersetzung vom Fran­zösischen ins Deutsche mit Google Translate kann so schlecht sein, dass man sie kaum versteht. In diesem Fall ist es besser, vom Französischen ins Englische zu übersetzen, denn das kann der Übersetzungsservice wesentlich besser.
Generell klappen Übersetzungen ins Deutsche – egal, ob vom Englischen, Französischen oder Spanischen – immer schlechter als in die andere Richtung. Das liegt an den vielen Flexions­formen (Verben, Substantive) in Deutsch und daran, dass die Wortreihenfolge stark umgestellt werden muss. Auch die vielen zusammen­gesetzten Wörter erschweren die Übersetzung.
Wenn ein Schweizer Unternehmen einen Text in Deutsch, Französisch und Italienisch benötigt, erzielt es daher das beste Ergebnis, wenn es mit der deutschen Version startet. Diese sollte jedoch nicht gleichzeitig in Französisch und Italienisch übersetzt werden, sondern zuerst nur in Französisch. Hat man dort die Fehler der maschinellen Übersetzung korrigiert, kann man in Italienisch übersetzen – mit gutem Resultat.



Das könnte Sie auch interessieren