Microsoft präsentiert kleines KI-Modell für Smartphones & Co.
Ein kleines Sprachmodell mit grossem Potenzial - so vermarktet Microsoft sein neues KI-Modell namens Phi-3 Mini. Es verfügt über 3,8 Milliarden Parameter und soll mehr Leistung erbringen als doppelt so grosse Sprachmodelle.
![(Source: iDoPixBox / stock.adobe.com)](https://data.netzwoche.ch/styles/np8_full/s3/media/2024/04/24/adobestock_651485148_preview_w.jpg?itok=345gbdk2)
Large Language Models (LLM) erfordern nicht nur umfangreiche Datenmengen zum Lernen respektive für ihr Training, sondern auch erhebliche Rechenleistung im Betrieb. Je nach Use Case rechnet sich das kaum. Deswegen entwickeln Tech-Konzerne auch kleine Sprachmodelle (SLM), die ressourceneffizienter arbeiten und sich auch auf weniger leistungsfähiger Hardware ausführen lassen - beispielsweise auf Smartphones oder Tablets.
Unter dem Namen Phi-3 will Microsoft eine ganze Reihe an SLMs auf den Markt bringen, die nicht nur leistungsfähig, sondern auch kostengünstig sein sollen. Den Anfang macht der Softwarehersteller mit Phi-3 Mini - ein Sprachmodell mit 3,8 Milliarden Parametern, das nach Angaben des Herstellers eine bessere Leistung erbringt als doppelt so grosse Sprachmodelle.
Phi-3 Mini ist bereits verfügbar, und zwar auf Microsoft Azure AI Studio, Hugging Face sowie Ollama und künftig auch als Nvidia NIM Microservice. Demnächst sollen auch weitere Modelle erhältlich sein, namentlich Phi-3 Small mit 7 Milliarden Parametern und Phi-3 Medium mit 14 Milliarden Parametern.
Lokal statt in der Cloud
Die Wahl des richtigen Modells hänge von den Anforderungen, der Komplexität der Aufgaben und den verfügbaren Ressourcen ab, schreibt Microsoft. Kleine Sprachmodelle würden sich beispielsweise für Unternehmen eignen, die KI-Anwendungen lokal auf Endgeräten und nicht in der Cloud ausführen möchten. So könnten SLMs aufgrund von Compliance-Vorgaben und Datenschutzgesetzen auch für stark regulierte Branchen interessant sein.
Ein weiterer potenzieller Vorteil von kleinen Sprachmodellen seien kürzere Reaktionszeiten: Weil die Daten auf den lokalen Geräten verbleiben würden und man die entsprechenden Anwendungen auch offline nutzen könne, liessen sich "Latenzen minimieren und der Schutz der Privatsphäre maximieren", lässt sich Luis Vargas, VP of AI bei Microsoft, im Blogbeitrag zitieren.
Apropos Sprachmodelle: Meta präsentierte kürzlich die nächste Generation seines Sprachmodells Llama - bald soll das LLM für Cloud-Anbieter wie AWS, Google oder Microsoft verfügbar sein. Lesen Sie hier mehr dazu.
![Jean-Pierre Mustier übernimmt als neuer CEO bei Atos. (Source: Atos.net)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/mustier_atos.jpg?itok=c11BX9xf)
Atos ernennt nächsten CEO
![G.V. Shivashankar entwickelt derzeit am PSI verschiedene Verfahren zur Diagnose und Prognose von Krebs. (Source: Paul Scherrer Institut PSI/Markus Fischer)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/web20231116_shivashankar_0048.jpg?itok=zfzwJ7s8)
KI-Bildanalyse kann Brustkrebs-Stadium besser identifizieren
![(Source: Kasia Derenda / unsplash.com)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/kasia-derenda-fl3rf_t8dms-unsplash.jpg?itok=72tLCDjs)
Phisher phishen am liebsten mit Microsoft
![(Source: freshidea - stock.adobe.com)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/02/adobestock_416609395.jpeg?itok=lzCTG-o-)
Erfolgreiche Co-Creation im Digital Banking dank Design Thinking
![Rolf Unterberger, Mitglied des Verwaltungsrats, gratuliert Chief Sales Officer Gianni Mastromarino mit einem Pokal (v.l.). (Source: zVg)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/25/pokaluebergabe_cmyk.jpg?itok=8-ERumlE)
Assmann IT-Solutions feiert 15-Jahre-Jubiläum
![(Source: Micha Brändli / unsplash.com)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/micha-brandli-xteagvru_1u-unsplash.jpg?itok=YakH3APY)
Mandiant stuft nordkoreanische Cyberbande als APT45 ein
![(Source: DC Studio/Freepik.com)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/ransomware.jpg?itok=Ke4dCDqV)
Angreifer nehmen kritische Infrastrukturen ins Visier
![(Source: NOAA / Unsplash)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/google_wetter-ki_2024.jpg?itok=3ZIDlofC)
Google vereint KI und Physik für Wettervorhersagen
![(Source: OrsiO / Pixabay.com)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/webcat-636172_1280.jpg?itok=4c5VDYw5)
Wenn orangene Katzen Unsinn veranstalten
![(Source: Pawina / stock.adobe.com)](https://data.netzwoche.ch/styles/teaser_small/s3/media/2024/07/26/proton_wallet_2024.jpeg?itok=cfViQUYL)