GenAI & Copyright

Microsoft will User vor Urheberrechtsverletzungen durch KI schützen

Uhr
von Yannick Chavanne und Übersetzung: Tanja Mettauer

Immer mehr Online-Websites und -Medien ergreifen Massnahmen, um zu verhindern, dass generative KIs ihre Inhalte scannen. Die Anbieter von GenAI, darunter neuerdings auch Microsoft, wollen ihre Nutzerinnen und Nutzer vor Urheberrechtsklagen schützen.

(Source: Timon / AdobeStock.com / freepngimg.com )
(Source: Timon / AdobeStock.com / freepngimg.com )

Microsoft hat angekündigt, dass das Unternehmen die Nutzerinnen und Nutzer seiner Copilot-Dienste entschädigt, wenn Urheber oder Verleger zu Recht der Meinung sind, dass die generative KI sich auf ihre Produktion gestützt hat, um künstliche Inhalte zu erzeugen. Dieser Fall kann durchaus eintreten, da die grossen Sprachmodelle, allen voran die von OpenAI, beim Durchforsten des Internets entstehen. Und in den meisten Fällen sind die betreffenden Inhalte urheberrechtlich geschützt. Um eine Klage zu vermeiden, können Schutzmassnahmen ergriffen werden, indem man verhindert, dass sie von den Bots der KI-Unternehmen gescannt werden. 

GPTBot wird von immer mehr Webseiten blockiert

Anfang August veröffentlichte OpenAI GPTBot, einen neuen Webcrawler zum Trainieren der zukünftigen Versionen von GPT-4 sowie GPT-5. Die Firma, die für ChatGTP verantwortlich ist, bietet jedoch die Möglichkeit, den Zugang zu ihrem Bot zu beschränken, und hat mitgeteilt, wie man dies über eine robots.txt-Datei tun kann. Wenig überraschend folgten viele Websites dem Beispiel und blockieren nun den Zugriff auf GPTBot. Es war bereits bekannt, dass die New York Times in ihren Nutzungsbedingungen ein Verbot gegen die Verwendung ihrer Inhalte für die KI-Schulung eingeführt hatte. Kurz darauf setzte die nordamerikanische Tageszeitung die Sperre technisch um, wie aus Untersuchungen von Originality.AI hervorgeht, einer Firma, die sich auf die Erkennung von plagiierten oder mithilfe von KI verfassten Texten spezialisiert hat. Laut dem Bericht vom 29. August haben 12 Prozent der 1000 meistbesuchten Webseiten GPTBot blockiert. Eine Zahl, die Woche für Woche stetig steigt.

Dazu gehören der Amazon-Marktplatz, das Quora-Forum und das Stellenportal Indeed. Aber auch die von Reuters, CNN, Shutterstock, Business Insider, Bloomberg, Wired, The Atlantic, The Verge, Vanity Fair oder auch Pixabay, Slideshare und Coursera. Der Common Crawl Bot, ein weiterer Crawler, der von einigen KI-Unternehmen zur ständigen Sammlung von Online-Daten eingesetzt wird, wurde seinerseits von 7 Prozent der 1000 meistbesuchten Websites gesperrt.

Auch die Frage, welche Inhalte zum Training von KIs genutzt werden, beschäftigt die Regulierungsbehörden. In den USA hat das U.S. Copyright Office mitgeteilt, dass es plant, eine Studie über die Frage von Urheberrechtsansprüchen durchzuführen, die die Urheberschaft der KI einschliessen, sowie über Urheberrechtsverletzungen im Zusammenhang mit von der KI erstellten Inhalten. Darüber hinaus wurden zwei Klagen von Autoren eingereicht, die behaupten, OpenAI habe ihre Urheberrechte verletzt, indem es KI-Modelle aus ihren Schriften trainiert habe.

Anbieter von generativer KI gehen voran

Wir haben es bei Microsoft gesehen: Die Anbieter von GenAI-Tools haben sich bereits Lösungen ausgedacht, um ihre Nutzer vor möglichen Klagen wegen Urheberrechtsverletzungen zu schützen. Wie sieht das konkret aus? Microsoft verspricht, seine Kunden gegen Vorwürfe der Verletzung geistigen Eigentums zu verteidigen, die sich aus der Nutzung und Verbreitung von Material ergeben, das von den GenAI Copilot-Diensten produziert wurde. "Genauer gesagt, wenn ein Dritter einen Geschäftskunden wegen Urheberrechtsverletzungen aufgrund der Nutzung eines Microsoft Copilot-Dienstes oder der damit erzeugten Inhalte verklagt, werden wir den Kunden verteidigen und den Betrag für alle nachteiligen Urteile oder Vergleiche zahlen, die sich aus der Klage ergeben, vorausgesetzt, der Kunde hat die Sicherheitsvorkehrungen und Inhaltsfilter verwendet, die wir in unsere Produkte integriert haben", stellt die Firma aus Redmond klar.

Übrigens: Adobe hat die Beta-Phase des generativen KI-Modells Firefly abgeschlossen und für den kommerziellen Gebrauch freigegeben. Hier lesen Sie mehr

Webcode
9GmF4d5E