Trefferquote von 75 Prozent
09.11.2020, 14:11 Uhr
Zoom: Bewegungen verraten getippte Wörter
Kann man anhand der Bewegungen vor der Webcam auf die auf der Tastatur getippten Wörter schliessen? US-Wissenschaftler konnten mit Hilfe von Schulter-Beobachtungen diesbezüglich eine Trefferquote von 75 Prozent erzielen.
Nutzer des Videokonferenz-Tools Zoom sollten auf ihre Körperbewegungen achten. Denn Forscher der University of Texas at San Antonio (UTSA) haben gezeigt, dass sich allein über die Bewegungen der Schulter die eingegebenen Wörter auf der Tastatur herausfinden lassen. In einer kontrollierten Testumgebung haben die Experten eine Trefferquote von 75 Prozent erzielt.
Schulter, Arme und Finger
«Unserem Team ist es gelungen, die Textinhalte, die Teilnehmer von Zoom-Videokonferenzen eingeben, rein auf Basis der Beobachtung ihrer Körperbewegungen zu identifizieren», zitiert «TechXplore» UTSA-Computerwissenschaftler Murtuza Jadiwala. Dazu reiche es, sich lediglich die Bewegungen der Schulter und der Arme der betreffenden Personen genauer anzusehen. «Daraus können wir dann auf die genauen Bewegungen ihrer Finger schliessen, was uns verrät, welche Tasten sie auf der Tastatur drücken», erklärt der Forscher.
Möglich ist das Ganze vor allem deshalb, weil mittlerweile die meisten User während solcher Konferenzen hochauflösende Webkameras verwenden, verrät Jadiwala. Das erlaubt es ihm, schon die kleinsten Veränderungen rund um die Schulter eines Teilnehmers zu erfassen und zu analysieren. «Wir haben eine spezielle Software entwickelt, die dann aus den beobachteten Tastenanschlägen die Wörter berechnet, die eingegeben wurden», verdeutlicht der Experte.
Trefferquote sinkt bei langen Haaren
Was auf den ersten Blick ziemlich weit hergeholt wirkt, scheint in der Praxis durchaus gut zu funktionieren. Bei ersten Tests in einer kontrollierten Laborumgebung mit speziellen Stühlen, Tastaturen und Webkameras konnten Jadiwala und sein Team mithilfe ihres Ansatzes in 75 Prozent der Fälle die eingetippten Textinhalte korrekt reproduzieren. In einem unkontrollierten Setting sinkt die Trefferquote allerdings deutlich und es kann im Schnitt nur mehr jedes fünfte Wort richtig erkannt werden.
Hinzu kommt, dass auch andere Faktoren ein Ausspionieren der eingetippten Texte bei Zoom-Konferenzen beträchtlich erschweren können, wie der UTSA-Wissenschaftler eingesteht: «Es macht beispielsweise einen grossen Unterschied, ob man ein langes oder kurzes Oberteil anhat. Auch lange Haare können das Ergebnis negativ beeinflussen, weil sie unter Umständen eine klare Sicht auf die Schultern verhindern.»