«Es wird sehr grosse Änderungen geben»

Gefahren des automatisierten Lernens

CW: Wenn man das Lernen automatisiert, können ja auch unvorhergesehene Dinge eintreten. Wo sehen Sie Gefahren und Risiken?

Volk: Neuronale Netze lernen aus grossen Textmengen, welche Begriffe wie stark zusammengehören. Da kommt zum Beispiel heraus, dass im Deutschen der Abstand zwischen «König» und «Königin» etwa gleich ist wie im Englischen der Abstand zwischen «King» und «Queen». Das ist wunderbar. Es kommt aber auch heraus, dass das Wort «Frau» näher zu «Haushalt» steht als das Wort «Mann», dieses dafür näher beim Wort «Karriere». Das heisst: Vorurteile und Stereotypen oder auch tatsächliche Zustände der Vergangenheit werden reproduziert. Das maschinelle Lernen wirkt quasi gesellschaftserhaltend, und wenn man etwas an der Gesellschaft ändern möchte, muss man schauen, dass man diese Tendenzen durchbricht.

CW: Gibt es weitere Schwierigkeiten?

Volk: Automatisches Lernen verspricht viele Erleichterungen. Aber die Frage ist: Wie viele persönliche Daten müssen wir dafür preisgeben? Das ist natürlich ein sehr generelles Problem. Ein anderer Punkt, der unser Gebiet im Speziellen betrifft: Wenn maschinelle Übersetzung immer besser wird und überall zur Verfügung steht, auch als Speech-to-Speech-Übersetzung: Wer wird dann noch Fremdsprachen lernen? Das könnte zum Hobby einer kleinen Fangemeinde werden. Politiker kommen dann schnell auf die Idee, den gesamten Fremdsprachenunterricht abzuschaffen. Das ist einerseits schade, weil mit dem Sprachenlernen ein sehr grosser Kulturaustausch einhergeht. Man kann aber auch sagen, das werde dadurch ausgeglichen, dass wir dann mit jedem Chinesen fliessend sprechen können. Was dieser Fortschritt genau mit uns macht, wissen wir noch nicht, aber ich glaube, es wird sehr grosse Änderungen geben.

CW: Wenn dereinst ein grosser Teil der Texte maschinell erstellt wird, besteht nicht die Gefahr, dass Regeln für die maschinelle Übersetzung selbst aus maschinellen Texten abgeleitet werden und sich das Ganze verselbstständigt?

Rios: Das ist natürlich ein Problem, und zwar schon heute. Wer ein System mit Texten aus dem Web trainieren will, muss sicherstellen, dass automatische Übersetzungen erkannt und herausgefiltert werden.

Volk: Das ist die rein technologische Sicht. Ganz allgemein wirkt sich computergenerierte Sprache auf die Entwicklung der natürlichen Sprachen aus. Ein simples Beispiel: Wenn ich mit dem Aufzug fahre, sagt die automatische Stimme: «Türe öffnet.» Was eigentlich ein unvollständiger Satz ist. Ich habe das jetzt aber schon so oft gehört, dass ich langsam anfange, es als natürlich zu empfinden. Es ist denkbar, dass die Sprache in Zukunft verarmt, weil der Computer nur bestimmte Formulierungen wählt, die wir immer wieder hören und dann selbst benutzen. Es könnten aber auch neue Variationen entstehen, so wie Jugendsprachen sich heute dieses Computerjargons bedienen und ihn kreativ einsetzen. Die genauen Auswirkungen kennt heute niemand. Es gibt z. B. Leute, die behaupten, dass Spelling Checker konservativ auf die Sprache einwirken. Begründung: Wenn man früher eine neue Schreibweise eigentlich besser fand als die alte, hat man einfach begonnen, sie zu benutzen und so konnte sie sich relativ schnell durchsetzen. Heute erinnert einen der Computer mit dem rot unterkringelten Wort immer daran: Das darfst du nicht benutzen, das ist falsch! Aber die Zeiträume, die wir da überblicken, sind noch zu kurz, um diese Behauptung zu prüfen.

CW: Hat Ihre eigene Arbeit auch konkrete Auswirkungen auf den Sprachgebrauch?

Volk: Wir haben Übersetzungssysteme für Film- und Fernseh­untertitel hergestellt, die im skandinavischen Raum ein­gesetzt werden. Die dänische Untertitlergewerkschaft – die gibt es wirklich – hat sich darauf bei mir beschwert, ich würde die dänische Sprache ruinieren. Die Untertitler kontrollieren zwar das, was unser System produziert, und wenn sie eine seltsame Formulierung das erste Mal sehen, korrigieren sie die auch. Wenn sie das aber zum fünften Mal sehen, finden sie es natürlich und lassen es. So wird es dann im dänischen Fernsehen ausgestrahlt. Und die Anzahl der Personen, die das liest, gerade bei diesen Soap Operas, übersteigt alles andere an Medienkonsum, was es in Dänemark gibt. Daher ist der Vorwurf, mein Einfluss auf die dänische Sprache sei gross und könne destruktiv sein, nicht ganz von der Hand zu weisen. Wir haben die Leute, die das kontrollieren, zwar instruiert: «Wenn ihr seltsame Sachen entdeckt, sagt es uns bitte, wir korrigieren das dann im System.» Aber die arbeiten dermassen unter Zeitdruck, da kommt wenig zurück.

CW: Warum wollen Firmen überhaupt noch Übersetzungssysteme kaufen, wenn es doch Google Translate gibt?

Volk: Ein API von Google kostet auch Geld, und ohne wird es bei grossen Mengen mühsam. Das wichtigste Argument ist aber, dass die Firmen ihre Dokumente nicht an Google übermitteln wollen. Banken, aber teilweise auch Unternehmen aus der Industrie, sagen: «Wir wollen so etwas wie Google Translate, aber auf unseren eigenen Servern. Und sobald wir es haben, sperren wir Google Translate.» Das ist ein wich­tiger Grund, weshalb wir da noch im Geschäft sind.



Das könnte Sie auch interessieren