Hardware, Entwicklungs- und Bereitstellungsumgebung

HPE und Nvidia lancieren Komplettsystem für generative KI

Uhr
von René Jaun und dwa

HPE und Nvidia haben ein vorkonfiguriertes Komplettsystem für die Entwicklung und den Betrieb von generativen KI-Modellen zusammengestellt. Die Hardware besteht aus einem HPE ProLiant Server und NVIDIA L40S GPUs.

(Source: hywards / Fotolia.com)
(Source: hywards / Fotolia.com)

Anlässlich seiner Hausmesse "HPE Discover" in Barcelona hat HPE eine Reihe neuer Produkte im Bereich der künstlichen Inteligenz (KI) vorgestellt. Dazu gehört ein vorkonfiguriertes Komplettsystem für KI-Tuning- und -Inferenz, das HPE zusammen mit Nvidia entwickelt hat. Es sei für Organisationen jeder Grösse geeignet, teilt HPE mit. Mit dem System sollen Kunden vortrainierte Basismodelle mit privaten Daten schnell anpassen und in den Betrieb bringen können. Dabei würden so genannte RAG-Workstreams (Retrieval Augmented Generation) die Datenqualität und Genauigkeit der Anwendung verbessern.

Zur Hardware des Systems schreibt HPE, dass es sich um eine Rack-Scale-Architektur mit dem HPE Proliant Server DL380a handle. Bestückt ist dieser mit NVIDIA L40S GPUs, NVIDIA BlueField-3 DPUs und der NVIDIA Spectrum-X Ethernet Networking Platform. Man habe das System für das Feintuning eines Llama-2-Modells mit 70 Milliarden Parametern dimensioniert, ergänzt HPE. Dieses System umfasse 16 Server und 64 GPUs.

Ausser der Hardware gehört auch das "Machine Learning Development Environment" von HPE dazu. Es biete neue Funktionen zum schnellen Prototyping und Testen von Modellen, heisst es weiter. Zudem vereinfache die "Ezmeral Software" mit neuen GPU-fähigen Funktionen die Bereitstellung und beschleunige die Datenvorbereitung für KI-Anwendungen in der Hybrid Cloud.

Nvidia steuert die Software "AI Enterprise" bei. Auch sie beschleunige die Entwicklung und Bereitstellung von KI-Produktionsumgebungen und sorge dabei für Sicherheit, Stabilität und Verwaltbarkeit. Sie soll unter anderem Werkzeuge für die Datenkuratierung und vortrainierte Modelle zur Optimierung von generativer KI im Unternehmen umfassen.

Das komplette vorkonfigurierte System wird im 1. Quartal 2024 bestellbar sein, wie das Unternehmen schreibt.

Eine Fülle an Neuheiten hat unlängst auch AWS an seiner Hausmesse "re:Invent" präsentiert. Hier erfahren Sie mehr über den neuen KI-Chatbot für den Arbeitsalltag und einen Super-Supercomputer.

Webcode
AybGNJWZ