Google I/O 2024 15.05.2024, 09:07 Uhr

Google Gemini ermöglicht mehr Funktionen und Individualität

Der grosse Star bei der diesjährigen Google-Entwicklerkonferenz I/O war Gemini. Die KI-Technologie hält Einzug in diverse Anwendungen und bietet neue Möglichkeiten bei der Entwicklung und Nutzung bekannter und neuer Google-Apps.

Der Fokus bei der Entwicklerkonferenz Google I/O 2024 liegt auf der verbesserten Nutzung von Google-Anwendungen

(Quelle: Google)

Google Gemini wird kontinuierlich weiterentwickelt, um als KI-Assistent komplexe Aufgaben zu übernehmen. Demnächst wird Gemini 1.5 Pro in Google Calendar, Tasks und Keep integriert, um komplexe Gruppenaktivitäten zu organisieren. Anwender können durch das Erstellen von sogenannten Gems ihre Unterstützung personalisieren. In Gmail kann der Chatbot E-Mails zu bestimmten Themen suchen und zusammenfassen sowie kontextbasierte Antwortvorschläge machen. Falls keine passende Antwort dabei ist, können Nutzer eigene Prompts eingeben, wofür eine entsprechende Box in die App integriert wird. In Google Chat agiert Gemini als virtueller Assistent, mit dem sich zum Beispiel Fragen beantworten Fortschritte dokumentieren und Informationen zusammenfassen lassen. In Zukunft soll Gemini auch im Alltag Unterstützung bieten, z.B. beim Einkauf oder bei der Warenrücksendung.

Als Schlüsseltechnologie sorgt Gemini für deutliche Verbesserungen bei der Nutzung und Funktionalität der Google Apps.

Quelle: Google

Veo und Imagen 3: Generative Modelle für Video und Bild

Mit Veo wurde an der I/O 2024 ein Modell zur Erstellung von Bewegtbild präsentiert. Veo generiert hochwertige 1080p Videos, welche die User mittels Prompts erstellen können. Mit Imagen 3 wurde das bisher hochwertigste Modell für «Bild-zu-Text»-Generation vorgestellt. Imagen 3 ist in unterschiedlichen Versionen, je nach Verwendungszweck, ab sofort im Bildgenerator ImageFX verfügbar (vorerst nur in den USA). Zudem ist eine baldige Integration in Vertex AI und weitere Google Produkte wie beispielsweise in Workspace oder Gemini App und Webauftritt geplant.

Mit Imagen lassen sich photorealistische Bilder in höchster Qualität mittels Texteingaben (Prompts) generieren.

Quelle: Google

An der I/O 2024 wurden mehrere neue KI-Modelle und Funktionen vorgestellt, die dabei helfen, diese Produkte auf neue, kreative Weise zu nutzen. Dazu gehört Gemini 1.5 Flash, das bisher schnellste und kostengünstigste Modell. Zudem wurde das Projekt Astra präsentiert - ein neuer Forschungsprototyp, der Googles Vision für die Zukunft von KI-Assistenzen zeigt.

Google Suche: Gruppierungen statt Listen

Die an der I/O 2024 präsentierten Updates für die Google Suche werden durch ein massgeschneidertes KI-Modell ermöglicht, das die erweiterten Fähigkeiten von Gemini mit der Suche zusammenführt. In Kürze soll es möglich sein, auch komplexe, mehrstufige Fragen zu stellen. Die Suche wird Generative KI nutzen, um Informationen thematisch zu recherchieren. Statt einer Liste mit Links werden die Inhalte unter KI-generierten Stichworten gruppiert. So wird die Suche verfeinert und neue Ideen können entdeckt werden. Ausserdem ermöglicht AI Overview das Fragen mittels Video. Das ist gerade dann hilfreich, wenn ein Problem einfacher gezeigt als beschrieben ist.

Android: neue Interaktion mit Smartphone

Android-Entwickler dürfen sich freuen: Gemini 1.5 Proc das qualitativ hochwertigere Antworten und multimodale Eingaben bietet, wird in Android Studio integriert.

Quelle: Google

Mit Google AI im Herzen des Android Betriebssystems erfindet Google die Interaktion mit Smartphones quasi neu. Gemini on Android ist eine neue Art von KI-Assistent, der in verschiedene Apps integriert werden kann. Android wird ausserdem das erste mobile Betriebssystem sein, das ein integriertes, geräteinternes KI-Modell - Gemini Nano - enthält. Informationen verbleiben so auf dem Gerät und sind komplett privat

Autor(in) Christian Bühlmann

Google Gemini ermöglicht mehr Funktionen und Individualität

Aktuelle Jobs