KI-Tests sorgen für Empörung
14.03.2019, 10:39 Uhr
IBM trainierte Gesichtserkennung mit Flickr-Fotos
Fast eine Million Bilder der Fotoplattform Flickr hat IBM genutzt, um seine Gesichtserkennungssoftware zu trainieren – allerdings ohne Zustimmung der betroffenen User.
Der IT-Riese IBM hat insgesamt 99,2 Millionen Bilder der Foto-Community Flickr für das Training seiner Gesichtserkennungssoftware verwendet und dabei einen wichtigen Punkt vergessen: das Einverständnis der Personen, die auf den Bildern zu sehen sind. Laut US-Medien hat der Technologiekonzern das betreffende Datenmaterial sogar noch an andere Unternehmen und Forschungseinrichtungen weitergegeben, um sie bei der Entwicklung ihrer eigenen Programme zu unterstützen. Dafür hagelt es nun Kritik von Datenschützern und Fotografen.
«Schmutziges kleines Geheimnis»
«Das ist das schmutzige kleine Geheimnis von solchen Datensätzen, mit denen Künstliche Intelligenz trainiert wird. Viele Wissenschaftler schnappen sich dafür einfach alle Fotos, an die sie herankommen», zitiert «NBC News» den Rechtsexperten Jason Schultz von der New York University. Für die Entwicklung einer gut funktionierenden Gesichtserkennung würden hunderttausende Bilder benötigt. «Diese Fotos kommen alle aus dem Internet und werden ohne die Zustimmung der Menschen, die sie dort hineingestellt haben, verwendet und nach Kategorien wie Alter, Geschlecht, Hautfarbe und ein Dutzend anderer Faktoren sortiert, um sie dann mit Forschern von Universitäten und Unternehmen zu teilen», erklärt Schultz.
Die fehlende Information der Betroffenen stösst vor allem bei Fotografen auf Unverständnis. Diese müssen nämlich sowohl bei der Erstellung als auch bei der Verwendung ihrer Aufnahmen sehr genau aufpassen und die entsprechenden Rechte mit den abgelichteten Personen schriftlich abklären. «Keiner der Leute, die ich fotografiert habe, hat eine Ahnung, dass seine Bilder auf diese Weise genutzt werden», kritisiert Greg Peverill-Conti, ein PR-Berater aus Boston, das Vorgehen des Konzern. Er steuerte über 700 Fotos zum IBM-Datensatz bei. Dass diese einfach so «missbraucht» werden können, habe ihn sehr überrascht.
IBM mit Beschwichtigungsversuch
«Wir nehmen die Privatsphäre von Individuen sehr ernst und unternehmen grosse Anstrengungen, um stets im Einklang mit den geltenden Datenschutzbestimmungen zu handeln», heisst es in einer ersten Reaktion von IBM. Das gelte auch für den konkreten Datensatz mit Flickr-Fotos, um den sich die aktuelle Diskussion dreht. Dieser kann nämlich dem IT-Giganten zufolge ausschliesslich von verifizierten Wissenschaftlern eingesehen werden. «Ausserdem ist darin nur solches Material enthalten, dass für die Öffentlichkeit frei zugänglich ist. Wenn jemand nicht in diesem Datensatz enthalten sein will, hat er auch die Möglichkeit, sich daraus entfernen zu lassen», betont das Unternehmen. Die Bilder, die von IBM zum Training der Gesichtserkennungssoftware genutzt wurden, standen unter der Creative-Commons-Lizenz – sie können also grundsätzlich mit wenigen Einschränkungen verwendet werden.
Hinweis: Der Text ist ursprünglich bei «Pressetext» erschienen und wurde von Markus Steiner verfasst.