Automatisierte Artikel

Wie eine KI für mehr weibliche Biografien auf Wikipedia sorgen soll

Uhr
von Rodolphe Koller und Übersetzung: Sophie-Kathrin Klimas

Nur etwa 20 Prozent der Biografien bei Wikipedia beziehen sich auf Frauen. Um das zu ändern, hat eine Meta-Forscherin ein KI-Modell entwickelt, das automatisch Artikel über weibliche Persönlichkeiten generieren kann. Der Algorithmus hat jedoch seine Grenzen.

(Source: venimo / iStock.com)
(Source: venimo / iStock.com)

Die Meta-Forscherin Angela Fan hat im Labor für künstliche Intelligenz in Paris ein Modell für einen Algorithmus entwickelt, der biografische Artikel über echte Persönlichkeiten erstellen kann. Ihre Idee ist es, das Tool zu nutzen, um Wikipedia mit Artikeln über Frauen zu füllen. Denn sie stellte fest, dass nur ein Fünftel der Biografien, die Wikipedia derzeit enthält, von Frauen handeln. Das ist ein Problem, wenn man bedenkt, dass die freie Enzyklopädie als Nachschlagewerk dient, bei Onlinerecherchen unter den ersten Ergebnissen erscheint und von Schülern und Schülerinnen oft als Quelle für Referate verwendet wird. Ausserdem werden die Wikipedia-Artikel auch dazu verwendet, Algorithmen zu trainieren, die diese verzerrte Darstellung einbeziehen können.

Automatisierte Generierung von Biografien

Die Forscherin sieht ihren Ansatz als Ergänzung zu den bestehenden Initiativen, Frauenbiografien "von Hand" zu schreiben. "Recherchieren, eine Bibliografie erstellen und diese schreiben sind intensive Tätigkeiten, aber es gibt eine Vielzahl von Informationen im Internet, die genutzt werden können, um die Geschichte von Frauen zu erzählen, deren Leistungen, Stimmen und Vermächtnisse vergessen oder marginalisiert wurden", erklärt sie im Meta Blog.

Angela Fan forscht für Meta in Paris, mit fokus auf "Machine Translation". (Source Meta AI Blog)

Das von Angela Fan entwickelte Modell geht in mehreren Schritten vor. Zunächst lernt es, im Internet die für die Biografie wichtigen Informationen zu identifizieren. Diese werden dann benutzt, um den eigentlichen Text zu verfassen, während ein drittes Modul die Bibliografie aus den von ihm verwendeten Quellen erstellt. Anhand einer Vorlage werden so nacheinander die verschiedenen Inhalte des Wikipedia-Artikels - "Jugend", "Bildung" und "Karriere", erstellt.

(Source: Meta AI)

Probleme mit automatisch generierten Inhalten

Das System leidet jedoch unter mehreren Problemen, die oft bei der automatischen Generierung von Texten entstehen. Erstens neigt es dazu, Verzerrungen aus seinen Quellen und Trainingstexten zu reproduzieren. So kann es zum Beispiel passieren, dass die Formulierung "weiblicher Wissenschaftler" statt "Wissenschaftlerin" verwendet wird oder dass ein übermässig grosser Teil des Artikels dem Privatleben gewidmet wird, nur weil das Internet mehr Informationen über diesen Aspekt weiblicher Persönlichkeiten bietet. Zweitens produzieren die Modelle zur Generierung von Inhalten manchmal unzuverlässige Informationen. Im Rahmen des Forschungsprojekts wurden 68 Prozent des Textes, der in den Biografien generiert wurde, nicht in den Quellen angegeben.

Darüber hinaus beeinträchtigt die algorithmische Generierung, sowie die Zensur von (un-)erwünschten Inhalten, das Verständnis der Nutzer und Nutzerinnen für die präsentierten Inhalte.

Lesen Sie auch: Nicht nur auf Wikipedia sind Frauen untervertreten. Auch in der IT mangelt es an Mitarbeiterinnen. Was es benötigt, um mehr Frauen für IT-Berufe zu gewinnen.

Webcode
DPF8_253883