Neural Image Assessment
19.12.2017, 15:00 Uhr
Google arbeitet an neuronaler Bildbewertung Nima
Google arbeitet an einer neuen Technik zur Bildbewertung und -bearbeitung. Das Tool Nima soll neben technischen beziehungsweise qualitativen Kriterien auch die Ästhetik beurteilen können.
Google arbeitet an einer neuen Technik zur Bildbewertung, genannt Nima (Neural Image Assessment). Das auf Machine Learning basierende Tool soll Bilder nicht nur in Hinblick auf die messbare Qualität sondern auch anhand ästhetischer Aspekte beurteilen.
In einem Vergleichstest lagen die von NIMA errechneten Werte extrem nah an jenen, die bei einer Bewertung durch reale Personen ermittelt wurden.
Quelle: Google
Neben der Kategorisierung soll das Tool auch dabei helfen, die Bilder mittels Künstlicher Intelligenz zu bearbeiten. Dazu zählen unter anderem die Optimierung der visuellen Qualität sowie die Minimierung wahrgenommener visueller Fehler wie zum Beispiel Bildrauschen.
Für die Bewertung der Aufnahmen zieht Nima Referenzbilder heran. Ist für die vorliegende Grafik eine passende Referenz vorhanden, kommen Bildqualitätsmetriken wie PSNR (Peak-Signal-to-Noise-Ratio), SSIM (Structural Similarity) zum Einsatz. Gibt es hingegen kein passendes Referenzbild, werden "blinde" Ansätze, wie Google es nennt, angewendet. Dabei werden statistische Modelle herangezogen, um die Bildqualität vorherzusagen.
Menschliche Wahrnehmung steht im Fokus
Beide Ansätze verfolgen das Ziel, einen Qualitätsfaktor vorherzusagen, der mit der menschlichen Wahrnehmung übereinstimmt. Ähnliche Techniken ziehen meist den Durchschnittswert heran. Nima aber nutzt für die Bewertung der Bilder eine Skala von eins bis zehn, wobei für jede mögliche Punktzahl eine Wahrscheinlichkeit errechnet. Die Bewertung mit der höchsten Wahrscheinlichkeit wird als Ergebnis dargestellt.
Um die Genauigkeit von Nima zu bestätigen, hat Google die damit errechneten Ergebnisse mit einigen Bewertungen von realen Menschen verglichen. Als Referenz diente hierfür eine AVA-Datenbank. AVA steht für "Aesthetic Visual Analysis". Jedes der Testbilder wurde von durchschnittlich 200 Personen bewertet.
Im Vergleichstest lagen die so ermittelten Ergebnisse extrem nah an jenen, die NIMA angegeben hatte.
Im Vergleichstest lagen die so ermittelten Ergebnisse extrem nah an jenen, die NIMA angegeben hatte.
In der Praxis könne Nima künftig etwa Nutzern bei der Auswahl von Bildern behilflich sein. Auch ein Echtzeit-Feedback bei der Aufnahme von Fotos sei denkbar. So dient die Technologie im Wesentlichen als Schnittstelle für den menschlichen Geschmack.