API und neue Tools

Update: Google gibt Gemini-KI für Entwickler frei

Uhr
von Dejan Wäckerlin und Yannick Züllig und René Jaun und msc, tme, dwa

Anfang Dezember 2023 hat Google ein KI-Modell namens Gemini lanciert. Es soll Informationen aus verschiedenen Quellen interpretieren können. Neu können auch Entwicklerinnen und Entwickler mit Gemini arbeiten.

(Source: zVg)
(Source: zVg)

Update vom 14.12.2023: Google weitet den Anwenderkreis seines neuen KI-Modells Gemini aus. Neu können es auch Entwicklerinnen und Entwickler nutzen, wie das Unternehmen mitteilt. Sie können – zumindest in einer Vorschau-Version – beispielsweise in der "Vertex AI."-Umgebung per Programmschnittstelle (API) darauf zugreifen, wie einem Google-Blogbeitrag zu entnehmen ist. Auch in "Duet AI", einem Produktivitäts-Assistenten für Entwickler, werde Gemini Einzug halten.

Die Öffnung des KI-Modells für Developer erfolge "schneller als erwartet", schreibt "Watson". Zudem senke Google für Entwicklerinnen und Entwickler die Preise, um die KI zu nutzen. Das Unternehmen befindet sich in einem Wettlauf mit OpenAI, dem Unternehmen hinter dem populären ChatGPT.

Update vom 12.12.2023:

Google trickst bei Gemini-Vorstellung

Google hat bei der Präsentation seines neuen KI-Modells "Gemini" geschummelt. In einem Demo-Video wurden Prompts unterschlagen und Antwortzeiten gekürzt, wie "Techcrunch" berichtet.

Zwar habe Gemini die Antworten generiert, welche im Video gezeigt werden, diese seien jedoch nicht auf dem gezeigten Videomaterial basierend entstanden. Vielmehr wurde zunächst das Video produziert, anschliessend zeigte das Google-Team dem KI-Modell Screenshots aus dem Video, zusammen mit Text-Prompts, um die Antworten zu generieren.

Ein Beispiel: Das offizielle Demo-Video zeigt eine Hand, welche die Handzeichen für "Schere", "Stein" und "Papier" formt. Daneben erscheint ein Text, welcher den angeblich von Gemini erzeugten Output darstellt. Dort steht "Oh, ich weiss, was du machst, du spielst 'Schere, Stein, Papier'!". Tatsächlich habe das Google-Team dem Modell aber drei Bilder mit den jeweiligen Gesten gezeigt und dazu geschrieben: "Was denkst du, mache ich hier? Hinweis: es ist ein Spiel." Darauf antwortet Gemini "Du spielst Schere, Stein, Papier."

Mit diesen Bildern hat Google die Antworten von Gemini erzeugt. (Source: Google)

Google verlinkt zwar im Hands-on die Herleitung der im Video gezeigten Interaktionen in der Youtube-Beschreibung, allerdings wird der Link erst sichtbar, wenn man die Beschreibung aufklappt. Auch wird im Video selbst nicht deklariert, dass es sich nicht um ein tatsächliches Hands-on handelt, sondern um eine stilisierte Darstellung der Interaktionen mit Gemini. 

Originalmeldung vom 7.12.2023

Google lanciert sein KI-Modell Gemini

Google hat Gemini lanciert - ein multimodales KI-Modell. Es soll in der Lage sein, Informationen aus verschiedenen Quellen, darunter Text, Bild, Audio, Video und Programmiersprachen, zu interpretieren und zu generalisieren, wie Google mitteilt.

Das Unternehmen möchte die erste Version für verschiedene Grössen und Anwendungsbereiche anpassen:

  • Gemini Ultra: Bei diesem Model handle es sich um das leistungsstärkste und grösste Modell, das für hochkomplexe Aufgaben gedacht sei.
  • Gemini Pro: Dieses Modell sei für ein breites Aufgabenspektrum bestimmt.
  • Gemini Nano: Dieses Modell richte sich an alle, die ein effizientes Modell auf ihren Endgeräten haben wollen.

Die Unterschiede zwischen den verschiedenen Modellen gehen laut "arstechnica.com" wohl primär auf die Zahl der verfügbaren Parameter zurückgehen. Mehr Parameter würden ein grösseres neuronales Netzwerk bedeuten, das komplexere Aufgaben besser bewältigen könnte.

Für Bard und Pixel 

Gemini ist in Bard integriert und in mehr als 170 Ländern und Regionen auf Englisch verfügbar, wie es weiter heisst. Mit der Einführung würden User Zugang zu einer Vielzahl neuer KI-Funktionen und Erweiterungen erhalten.

Daneben soll Gemini auch aufs Pixel kommen. Pixel 8 Pro ist gemäss Google das erste Smartphone, auf dem Gemini Nano läuft. Dies soll neue Funktionen wie das Zusammenfassen von Aufnahmen in der Rekorder-App ermöglichen. Die Pixel Feature Drop erhalte zudem neue KI-Funktionen für Pixel 8 Pro und andere Modelle der Pixel-Familie. Google möchte Gemini in den nächsten Monaten für weitere Produkte und Dienste einführen, darunter Search, Ads, Chrome und Duet AI. Entwicklerinnen und Entwickler sowie Unternehmen sollen ab dem 13. Dezember 2023 die Möglichkeit erhalten, mit Gemini zu arbeiten.

Die Einführung von Gemini sei das Ergebnis einer Zusammenarbeit von Teams aus allen Bereichen von Google. Es ist gleichzeitig das bisher grösste Forschungs- und Entwicklungsprojekt von Google, wie es weiter heisst.

Google Cloud kündigt Cloud TPU v5p an

Ausserdem kündigte Google Cloud heute Cloud TPU v5p an, einen KI-Beschleuniger. TPUs bilden die Grundlage für das Training und die Bereitstellung von KI-gestützten Produkten, darunter Gemini wie auch Plattformen, zum Beispiel YouTube, Gmail und Google Maps. Auch ein "KI-Hypercomputer" soll gemäss dem Unternehmen bald kommen. Hierbei handle es sich um eine Supercomputer-Architektur, die ein integriertes System aus leistungsoptimierter Hardware, offener Software, ML-Frameworks und Nutzungsmodellen verwende.

Übrigens: Google bietet mit Graphcast ein KI-System an, das das Wetter bis zu zehn Tage in die Zukunft voraussagen kann. Mehr dazu lesen Sie hier.

Webcode
BDWEMu5m