Google präsentiert Gemini 3.5 Flash und das neue Modell Gemini Omni.
Photo Credit: Google
Google erweitert seine Gemini-KI mit neuen Agenten- und Videofunktionen.
Google I/O 2026 fand am Mittwoch statt und gab erstmals einen Blick auf die neuen Funktionen und Produkte, die das Unternehmen für Nutzer und Unternehmen veröffentlichen wird. Google-CEO Sundar Pichai eröffnete die Keynote und stellte neue KI-Werkzeuge wie Docs Live vor. Die spannendste Innovation des Unternehmens wurde jedoch erst enthüllt, als DeepMind-CEO Demis Hassabis die Bühne betrat: Gemini Omni. Zusätzlich stellte das Unternehmen auch die Gemini-3.5-Serie für Nutzer vor.
Während der Live-Veranstaltung präsentierte das Unternehmen die Gemini-3.5-Serie. Als Nachfolger der Gemini-3.1-Serie bringen die neuen Modelle deutliche Verbesserungen bei agentenbasierten Funktionen und der Programmierleistung.
Derzeit rollt Google das Modell Gemini 3.5 Flash weltweit für alle Nutzer in der Gemini-App und im KI-Modus der Google-Suche aus. Zusätzlich steht das Modell Entwicklern über die Antigravity-Plattform sowie über die Gemini-API in AI Studio und Android Studio zur Verfügung.
Google erklärt, dass Gemini 3.5 Flash „Leistung auf Frontier-Niveau mit vierfacher Geschwindigkeit vergleichbarer Frontier-Modelle bei weniger als der Hälfte der Kosten“ liefert.
Basierend auf internen Tests behauptet das Unternehmen, dass Gemini 3.5 Flash Claude Sonnet 4.6, Claude Opus 4.7 und GPT-5.5 in MCP Atlas und Toolathlon für agentenbasierte Leistung, Finance agent v2 für Finanzanalysen, MMMU Pro für multimodales Verständnis sowie MRCR v2 für die Verarbeitung langer Kontexte übertrifft.
Gemini 3.5 Flash soll außerdem schneller sein als Claude Opus 4.7 und GPT-5.5, indem das Modell 289 Tokens pro Sekunde für die Ausgabeerstellung verwendet.
„Gemini 3.5 Flash ist unser bislang stärkstes Modell für agentenbasierte Aufgaben und Programmierung und übertrifft Gemini 3.1 Pro bei anspruchsvollen Coding- und Agentic-Benchmarks“, erklärte das Unternehmen.
Abgesehen von den Leistungswerten scheint die größte Stärke des Modells die agentenbasierte Arbeitsweise zu sein. Das Unternehmen erklärte, dass das Modell die Antigravity-Plattform nutzen konnte, um innerhalb von nur zwölf Stunden ein vollständig funktionierendes Betriebssystem zu erstellen. Dafür wurden 93 Agenten parallel eingesetzt und weniger als 1.000 US-Dollar (rund 98.000 Rupien) an API-Kosten verursacht.
Gemini Omni ist Googles erstes Videogenerierungsmodell, das multimodale Eingaben innerhalb einer einzigen Anfrage kombinieren kann. Das bedeutet, dass eine einzelne Anfrage Videos, Audio, Texte und Bilder enthalten kann, um Inhalte zu erstellen.
Welche Inhalte genau erstellt werden können, wurde bislang nicht näher erklärt. Aktuell wird das Omni-Flash-Modell jedoch zur Videogenerierung verwendet.
Zusätzlich können Nutzer Videos per Gespräch bearbeiten. Das Modell kann einzelne Elemente wie Charaktere, Objekte, Hintergründe und weitere Bestandteile verändern.
Gemini Omni Flash wird derzeit weltweit für Google-AI-Plus-, Pro- und Ultra-Abonnenten über die Gemini-App und Google Flow ausgerollt.
Außerdem wird das Modell ab dieser Woche kostenlos für Nutzer von YouTube Shorts und der YouTube-Create-App bereitgestellt.
Werbung
Werbung
Lenovo Legion 5 15IAX11 With 15.3-Inch OLED Display, Up to Intel Core Ultra 9 CPU Listed Online