Nvidia sammelt Daten im grossen Stil
Nvidia will mit Video-Scraping bei Youtube, Netflix und Co. täglich eine Datenmenge sammeln, die der entspricht, die ein Mensch während seines Lebens visuell wahrnimmt. Der verwendete Open-Source-Downloader soll von 20 bis 30 virtuellen Maschinen unterstützt werden, um nicht blockiert zu werden.
Chip-Gigant Nvidia soll laut internen Dokumenten, die von "404 Media" aufgedeckt wurden, in grossem Stil Videos aus dem Internet gesammelt haben, berichtet der "Standard". Das Ziel dieses Projekts, das den Namen "Cosmos" trägt, sei, die KI-Modelle des Unternehmens mit einer grossen Menge an visuellen Daten zu trainieren.
Nvidia strebte an, täglich eine Datenmenge zu sammeln, die dem entspricht, was ein Mensch in einem ganzen Leben visuell wahrnimmt. Das seien schätzungsweise etwa 53 Jahre oder 464’000 Stunden an Videos. Diese Daten sollen für das KI-Training verschiedener Anwendungen genutzt werden, dazu gehören der "Omniverse-3D-Welt-Generator", autonome Fahrsysteme und "Digital Humans" ("Digitale Menschen").
Ethische Bedenken bei Mitarbeitenden
Die Methode, die Nvidia dabei anwende, sei ebenso umstritten: Mithilfe automatisierter Tools werden Millionen von Videos von Plattformen wie YouTube und Netflix heruntergeladen. Um nicht blockiert zu werden, sei der verwendete Open-Source-Youtube-Downloader von 20 bis 30 virtuellen Maschinen unterstützt worden, die regelmässig die IP-Adressen erneuern sollten.
Nvidia rechtfertigt dieses Vorgehen mit dem Argument, dass das Urheberrecht primär die Ausdrucksform, nicht aber die zugrundeliegenden Fakten oder Ideen schütze. Zudem beruft sich das Unternehmen auf die sogenannte "faire Nutzung" für transformative Zwecke.
Über die rechtlichen Aspekte hinaus wirft die Praxis des Video-Scrapings auch ethische Fragen auf. Von Mitarbeiterseite habe es Bedenken hinsichtlich der Rechtmässigkeit und Ethik des Vorgehens gegeben.
An der KI-Messe GTC in Kalifornien hat Nvidia im März 2024 eine neue GPU für KI-Training vorgestellt. Mit der GPU soll das Training von KI-Modellen weniger Energie verbrauchen. Mehr dazu lesen Sie hier.
Am Digital Summit 2026 trifft globale Technologie auf europäische Souveränität
Schweizer Bevölkerung kennt KI und Bitcoin - aber die Blockchain kaum
Kanton Zug und Uni Luzern rufen neues Blockchain-Forschungsinstitut ins Leben
85% Weniger Ransomware Risiko dank neuer Methode
Warum Schweizer Daten in die Schweiz gehören
Warum nur wenige Unternehmen echten Nutzen aus KI ziehen
AI im Marketing: Prognose für 2026
Mitarbeitererfahrung 2026: Was Mitarbeitende vom Arbeitsplatz erwarten
Intel kämpft mit Lieferengpässen