Fokus auf autonome KI-Agenten

Google lanciert KI-Modell Gemini 3

Uhr
von Joël Orizet und NetzKI Bot und cbi

Mit Gemini 3 hat Google das Herzstück seiner neuen Strategie für autonome KI vorgestellt. Das neue KI-Modell kann interaktive Benutzeroberflächen generieren und erscheint zusammen mit der Entwicklungsplattform Google Antigravity, auf der KI-Agenten selbstständig Programmieraufgaben lösen sollen.

(Source: zVg)
(Source: zVg)

Google hat die dritte Generation seiner KI-Modellreihe Gemini präsentiert. Als erste Variante ist Gemini 3 Pro laut dem Unternehmen ab sofort weltweit in der Gemini-App für Web und Smartphones verfügbar. Das Modell übertreffe seinen Vorgänger 2.5 Pro in wichtigen Benchmarks. So führe es das LMArena-Ranking an - diese Rangliste entsteht, indem Menschen die Antworten verschiedener KI-Modelle direkt miteinander vergleichen. Google gibt zudem an, dass das Modell komplexe Schlussfolgerungen auf PhD-Niveau beherrsche.

Diese Behauptung will Google mit Ergebnissen diverser Tests untermauern. So habe das Modell bei "Humanity's Last Exam" - einem Benchmark, der interdisziplinäres Denken auf Expertenniveau prüft - einen Wert von 37,5 Prozent ohne Tool-Nutzung erreicht. Bei "GPQA Diamond", einer Sammlung von Fachfragen, die sich nicht durch einfache Websuchen beantworten lassen, sei ein Wert von 91,9 Prozent erzielt worden.

Drei Balkendiagramme vergleichen KI-Modelle in Tests zu Wissen und Logik. Die blauen Balken für Gemini 3 Pro und Deep Think sind in allen Tests am höchsten und übertreffen die grauen Balken der Konkurrenz.

Leistungsvergleich: In den von Google präsentierten Benchmarks übertreffen die neuen Gemini-3-Modelle (blau) ihre Vorgänger und Konkurrenzmodelle. (Source: zVg)

Ein Kontextfenster von einer Million Tokens unterstützt die multimodalen Fähigkeiten, also die Verarbeitung von Formaten wie Text, Bild, Video und Code. Zusätzlich kündigte Google den Modus "Gemini 3 Deep Think" an, der die Fähigkeit zu logischem Schlussfolgern weiter steigern soll. Vor seiner allgemeinen Veröffentlichung durchläuft dieser noch Sicherheitsprüfungen.

Neue Werkzeuge für autonome Systeme

Ein strategischer Schwerpunkt der neuen Generation liegt auf der Entwicklung autonomer KI-Agenten. Zu diesem Zweck führt Google die "Antigravity" ein. Auf der Plattform sollen Entwicklerinnen und Entwickler KI-Agenten bauen können, die selbstständig auf Werkzeuge wie Editor, Terminal und Browser zugreifen. KI könne sich somit von einem assistierenden Werkzeug zu einem autonomen System entwickeln, das komplexe Aufgaben plane und umsetze, verspricht Google.

Eine zentrale Neuerung sind die sogenannten "Generative User Interfaces": Die KI generiert dabei nicht nur Text und Code, sondern auch auf den jeweiligen Befehl zugeschnittene, interaktive Benutzeroberflächen. In der Gemini App zeigt sich diese Fähigkeit in zwei neuen experimentellen Features: "Dynamic View" und "Visual Layout". Ersteres generiere auf Basis der Anfrage eine massgeschneiderte Benutzeroberfläche, letzteres erzeuge Darstellungen im Magazinstil. Im "AI Mode" der Google Suche soll die Funktion ebenfalls verfügbar sein, um interaktive Werkzeuge zu erzeugen.

Drei nebeneinander gereihte, KI-generierte Webseiten-Layouts. Links: Vergleich von Wolkenkratzern. Mitte: Interaktives Pizza-Rezept. Rechts: Einrichtungs-Guide im Flamingo-Stil.

Beispiele für Googles "Generative User Interfaces": Die KI gestaltet je nach Anfrage komplett unterschiedliche Layouts - vom Gebäudevergleich (links) über ein Rezept (Mitte) bis zum Einrichtungs-Guide (rechts). (Source: zVg)

Als direkte Anwendung der Agenten-Technologie startet der "Gemini Agent" als experimentelles Feature für Abonnentinnen und Abonnenten in den USA. Dieses Werkzeug kann laut Mitteilung mehrstufige Aufgaben ausführen, indem es sich mit Google-Apps wie Kalender und Gmail verbindet, um beispielsweise einen Mietwagen basierend auf Fluginformationen zu buchen. Gemäss Google soll der Agent vor kritischen Aktionen eine Bestätigung von der Nutzerin oder dem Nutzer einholen.

Einführung in Etappen

Das Unternehmen bezeichnet Gemini 3 als sein bisher sicherstes Modell und verweist auf umfassende interne Sicherheitstests sowie auf die Zusammenarbeit mit externen Fachleuten und dem UK AI Security Institute.

Gemini 3 Pro ist ab sofort in der Gemini App sowie für Entwicklerinnen und Entwickler im AI Studio und über die Gemini CLI und Google Antigravity verfügbar. Unternehmenskunden können das Modell über Vertex AI und Gemini Enterprise nutzen. Die Generative-UI-Funktionen im AI Mode sind zunächst für Abonnentinnen und Abonnenten von Google AI Pro und Ultra in den USA verfügbar. Weitere Modelle der Gemini-3-Serie sind für einen späteren Zeitpunkt geplant.

 

Übrigens: Auch ChatGPT-Hersteller OpenAI stellte unlängst neue KI-Modelle vor, die mit Geschwindigkeit und logischem Schlussfolgern punkten sollen - mehr dazu lesen Sie hier

Webcode
K5bgLzLn