14.11.2017, 15:35 Uhr
KI-Algorithmus erkennt Emotionen in der Stimme
Forscher haben einen KI-Algorithmus entwickelt, mit dem Emotionen in der Stimme erkannt werden können. Trotz erster Erfolge hat das System unerklärlicherweise bei der Unterscheidung von Freude und Ärger noch Probleme.
Russische Forscher haben einen Algorithmus entwickelt, der auf Basis Künstlicher Intelligenz (KI) acht verschiedene Basisemotionen nur anhand der Stimme erkennt. Das neuronale Netzwerk ist von Wissenschaftlern der National Research University Higher School of Economics getestet worden und hatte eine Trefferquote von 71 Prozent. Dennoch bleibt die Emotion Freude aufgrund der Verwechslung mit Ärger ein Rätsel für den KI-Algorithmus.
Ähnelt Bilderkennung
«Die Unterscheidung von acht Basisemotionen angesichts des vielseitigen Ausdrucksspektrums erscheint willkürlich. Zudem gibt es viele verschiedene Modelle, die hier einen Versuch der Klassifizierung vornehmen», erläutert Peter Purgathofer vom Institut für Gestaltungs- und Wirkungsforschung der TU Wien. Eine Unterscheidung zwischen Freude und Ärger sei deshalb schwierig, da beide Emotionen eine starke Erregung gemein haben. «Zudem ist eine Reduktion auf die Stimme als einzigem Indikator für einen Gemütszustand ein schwieriges Unterfangen», resümiert Purgathofer.
Zu den in der Studie eingeschlossenen Emotionen zählen Gleichgültigkeit, Gemütsruhe, Freude, Trauer, Ärger, Angst, Ekel sowie Überraschung. Die Forscher haben Sprachaufzeichnungen von 24 Schauspielern, die Phrasen in verschiedenen Stimmungen vorlesen, in Bilder, sogenannte Spektrogramme, transformiert. Dies gab ihnen die Möglichkeit, den Computer - ähnlich wie bei Bilderkennung - mit den Stimmen zu füttern.
Zu den in der Studie eingeschlossenen Emotionen zählen Gleichgültigkeit, Gemütsruhe, Freude, Trauer, Ärger, Angst, Ekel sowie Überraschung. Die Forscher haben Sprachaufzeichnungen von 24 Schauspielern, die Phrasen in verschiedenen Stimmungen vorlesen, in Bilder, sogenannte Spektrogramme, transformiert. Dies gab ihnen die Möglichkeit, den Computer - ähnlich wie bei Bilderkennung - mit den Stimmen zu füttern.
Starke Emotionen schwierig
Während das neuronale Netzwerk die Gemütszustände Gleichgültigkeit, Gemütsruhe, Trauer, Ärger, Ekel und Angst präzise aus der Stimme erkannt hat, ist es bei Freude zu Schwierigkeiten gekommen. Freude konnte nur zu 45 Prozent richtig interpretiert werden, da diese Emotion häufig mit Ärger sowie Angst verwechselt wurde. Unterdessen ist Überraschung des Öfteren als Ekel missverstanden worden.
«Unglücklicherweise hat unser neuronales Netzwerk Probleme damit, Freude und Ärger auseinanderzuhalten. Dies liegt daran, dass es sich hierbei um die stärksten Emotionen handelt, die sich auf den Spektrogrammen leicht ähneln», schildert Studienleiterin Anastasiya Popova. Die Wissenschaftler sind überzeugt, dass der KI-Algorithmus nach einer Überarbeitung zur Verbesserung von Smart Assistants beiträgt. (www.pressetext.com)
«Unglücklicherweise hat unser neuronales Netzwerk Probleme damit, Freude und Ärger auseinanderzuhalten. Dies liegt daran, dass es sich hierbei um die stärksten Emotionen handelt, die sich auf den Spektrogrammen leicht ähneln», schildert Studienleiterin Anastasiya Popova. Die Wissenschaftler sind überzeugt, dass der KI-Algorithmus nach einer Überarbeitung zur Verbesserung von Smart Assistants beiträgt. (www.pressetext.com)