Versteht Bilder und löst komplexe Aufgaben

Upgrade von ChatGPT: OpenAI stellt GPT-4 vor

Uhr
von René Jaun und cla

Mit GPT-4 entwickelt OpenAI seine künstliche Intelligenz weiter. Die neue ChatGPT-Version soll kreativer und zuverlässiger sein und differenziertere Anweisungen verstehen. Neu kann GPT-4 auch Bilder verarbeiten. Ein Anwendungsbeispiel dafür liefert eine App für blinde Menschen.

(Source: Timon / AdobeStock.com)
(Source: Timon / AdobeStock.com)

Die künstliche Intelligenz (KI) hinter ChatGPT erhält ein Upgrade. OpenAI hat unter dem Namen GPT-4 die nächste Version seines KI-Modells vorgestellt. Dieses habe ein breiteres Allgemeinwissen und verbesserte Problemlösungsfähigkeiten. Dadurch könne es komplexere Aufgaben besser und akkurater lösen, schreibt OpenAI.

Mehr Kreativität, mehr Kontext

Zudem sei GPT-4 kreativer als der Vorgänger GPT-3.5. Die KI könne etwa gemeinsam mit dem Nutzer "Songs komponieren, Drehbücher schreiben oder den Schreibstil eines Benutzers lernen".

Als Beispiel einer komplexen Aufgabe nennt OpenAI unter anderem folgendes: "Andrew ist von 11 bis 15 Uhr frei, Joanne ist von 12 bis 14 Uhr und dann von 15:30 bis 17 Uhr frei. Hannah ist mittags für eine halbe Stunde und dann von 16 bis 18 Uhr verfügbar. Welche Möglichkeiten gibt es für den Beginn einer 30-minütigen Besprechung für Andrew, Hannah und Joanne?" Hier schlägt GPT-4 ein Treffen zwischen 12:00 und 12:30 Uhr vor. Laut "Reuters" demonstrierte OpenAI während der Produktdemonstration zudem, wie GPT-4 Personen beim Berechnen ihrer Steuern helfen könne.

Des Weiteren könne GPT-4 bis zu 25›000 Textzeichen als Eingabe verarbeiten, heisst es auf der Produkteseite. Im Beispiel erhält die KI den Wikipedia-Text der Sängerin Rihanna und den Auftrag: "Beschreibe ihren Auftritt am Superbowl und warum dieser besonders war."

Skizzen umsetzen und Kühlschränke analysieren

Die neuen Text-Fähigkeiten von GPT-4 stehen zahlenden ChatGPT-Usern zur Verfügung, wie OpenAI mitteilt. Für Entwickler können sie auch per API genutzt werden. Ohne Mängel ist die neue KI übrigens nicht: Sie beantworte zwar weniger Anfragen nach "unerlaubten Inhalten", bemerkt OpenAI. Dennoch arbeite man noch an Problemen wie etwa sozialen Verzerrungen oder Halluzinationen.

Aktuell lediglich als "Forschungsvorschau und nicht öffentlich verfügbar" ist laut OpenAI zudem die Möglichkeit, GPT-4 nicht nur Text, sondern auch Bilder als Input zu übergeben. Damit eröffnen sich für die KI eine Vielzahl neuer Einsatzmöglichkeiten. An der Produktdemonstration führte OpenAI-Chef Greg Brockman etwa vor, wie die KI aus einer auf Papier gezeichneten Design-Skizze eine entsprechende Website erzeugte. Als weiteres Anwendungsbeispiel zeigt OpenAI, wie GPT-4 die Aufnahme eines Kühlschrankes analysiert und dem Nutzer auf Wunsch mitteilt, was er mit den darin erkannten Lebensmitteln alles Kochen kann.

Blinden Menschen assistieren

Zu den ersten Unternehmen, die die Bildverarbeitungsfähigkeiten von GPT-4 bereits einsetzen, gehört das Unternehmen Be My Eyes. Über die gleichnamige App der Firma aus Dänemark können sich blinde Menschen per Video-Call mit Sehenden verbinden und bei visuellen Herausforderungen assistieren lassen, etwa beim Lesen des Ablaufdatums auf Lebensmitteln, beim Erkennen von Farben der Kleider oder bei der Orientierung in unbekannten Umgebungen.

Neu testet Be My Eyes eine Funktion namens "Virtual Volunteer". Unternehmens-CTO Jesper Hvirring erklärt, dass dabei die besonderen analytischen Fähigkeiten von GPT-4 herausstechen: "Einfache Bilderkennungsanwendungen sagen Ihnen nur, was vor Ihnen liegt", lässt er sich zitieren. "Sie sind nicht in der Lage, auszuführen, ob die Nudeln die richtigen Inhaltsstoffe haben oder ob das Objekt auf dem Boden nicht nur ein Ball, sondern eine Stolperfalle ist - und dies zu kommunizieren."

Laut der Mitteilung kennt Be My Eyes einen User, der sich mit dem GPT-4-Feature sicher auf einer Zugreise assistieren liess. Dabei habe ihn die App über seinen aktuellen Standort informiert und ihn mit klaren Schritt-für-Schritt-Anweisungen zu seinem Ziel versorgt.

Die Möglichkeiten von ChatGPT scheinen grenzenlos. Trotz aller Vorteile birgt die neue KI aber auch grosse Risiken - vor allem für die Cybersecurity. Im Webinar von SwissCyberSecurity.net am 23. März um 10 Uhr referiert ein Ex-Mitarbeiter des israelischen Militärgeheimdienstes und es diskutieren weitere Top-Experten aus Wirtschaft und Lehre darüber, wie Künstliche Intelligenz die Karten zwischen CISOs und Cyberkriminellen neu mischt. Mehr Infos und den Anmeldelink finden Sie hier.

Wie ChatGPT und künstliche Intelligenz die Industrie sonst noch verändern, lesen Sie im Themendossier.

Webcode
CBQSko6Q