ZHAW und FHNW 26.05.2021, 11:50 Uhr

Forschende wollen Schweizer Dialekte digitalisieren

Die ZHAW und die FHNW rufen zu einer Datensammlung von Schweizer Dialekten in der Deutschschweiz auf. Mit den digitalisierten Dialekten sollen Computerprogramme trainiert werden.
Die Plattform dialektsammlung.ch
(Quelle: Screenshot/NMGZ)
Sprachassistenten wie Siri oder Alexa verstehen bei gesprochenem Schweizerdeutsch oft nur Bahnhof. Einer der Gründe dafür liegt offenbar am Mangel an Audiodateien, die nötig sind, um diese Systeme zu trainieren. Für Techriesen wie Google oder Apple ist der Schweizer Markt zu klein, um in eine Digitalisierung zu investieren. Das Entwickeln einer Lösung wollen nun die ZHAW und die FHNW übernehmen, schreiben die beiden Hochschulen in einer gemeinsamen Mitteilung.
Darin rufen sie die Bevölkerung in der Deutschschweiz auf, bei einer Datensammlung von Schweizer Dialekten mitzumachen. «Mindestens 2000 Stunden Aufnahmen von schweizerdeutschen Dialekten sollen zusammenkommen, damit wir eine gute Datenbasis haben», sagt Mark Cieliebak vom ZHAW-Centre for Artificial Intelligence (CAI). Manfred Vogel von der FHNW ergänzt: «Diese Daten werden wir anschliessend verwenden, um einem Algorithmus basierend auf künstlicher Intelligenz beizubringen, schweizerdeutsche Sprache zu verstehen und automatisch in hochdeutschen Text umzuwandeln».
Für das Projekt wurde eine Webapplikation entwickelt, mit der die Freiwilligen eigene Audioaufnahmen erstellen können. In der App können die Teilnehmenden sehen, aus welchen Kantonen bereits Sprachaufnahmen vorhanden sind – und welche Kantone und Dialekte noch fehlen.
Solche Sätze können Sie in Ihrem Dialekt aufzeichnen und einschicken
Quelle: Screenshot/NMGZ
Wer möchte, kann beim Projekt mitmachen und auf der Plattform dialektsammlung.ch hochdeutsche Sätze im eigenen Dialekt sprechen. Die Forscher schreiben, man solle die Sätze so sprechen, als würde man Sie zu Freunden sagen; gesucht sei eine möglichst natürliche, alltägliche Sprache.
Alternativ kann man bereits aufgezeichnete Sätze prüfen.
Oder Sie prüfen, ob ein Audio den Satz korrekt wiedergibt und die Aufnahme gut verständlich ist
Quelle: Screenshot/NMGZ
«Weil wir den Datensatz für Forschungszwecke veröffentlichen, können Computerprogramme entwickelt werden, die dann in Zusammenarbeit mit lokalen Firmen für verschiedene Zwecke eingesetzt werden können», erklärt Manuela Hürlimann von der Swiss Association for Natural Language Processing (SwissNLP). Hürlimann koordiniert und leitet das Projekt.
Unterstützt werden die beiden Hochschulen vom Media Technology Center der ETH und der Universität Zürich. Finanziert wird das Projekt mit internen Mitteln der ZHAW und FHNW sowie mit finanzieller Unterstützung des Schweizer Nationalfonds und der AXA Versicherung.



Das könnte Sie auch interessieren