Buyl et al. (2024): Large Language Models Reflect the Ideology of their Creators

In dem Blogbeitrag Digitale Souveränität: Europa, USA und China im Vergleich wird deutlich gemacht, dass Europa, die USA und China unterschiedliche Ansätze bei dem Thema Digitale Souveränität haben. Diese grundsätzlichen Unterschiede zeigen sich auch in den vielen Large Language Models (Trainingsdatenbanken), die für KI-Anwendungen benötigt werden.

Es wundert daher nicht, dass in dem Paper Buyl et al. (2024): Large Language Models Reflect The Ideology of their Creators folgende Punkte hervorgehoben werden:

“The ideology of an LLM varies with the prompting language.”

In dem Paper geht es um die beiden Sprachen Englisch und Chinesisch für Prompts, bei denen sich bei den Ergebnissen Unterschiede gezeigt haben.

“An LLM’s ideology aligns with the region where it was created.”

Die Region spielt für die LLMs eine wichtige Rolle. China und die USA dominieren hier den Markt.

“Ideologies also vary between western LLMs.”

Doch auch bei den “westlichen LLMs” zeigen sich Unterschiede, die natürlich jeweils Einfluss auf die Ergebnisse haben, und somit auch manipulativ sein können.

Die Studie zeigt wieder einmal, dass es für einzelne Personen, Gruppen, Organisationen oder auch Gesellschaften in Europa wichtig ist, LLMs zu nutzen, die die europäischen Sprachen unterstützen, und deren Trainingsdaten frei zur Verfügung stehen. Das gibt es nicht? Doch das gibt es – siehe dazu

Open Source AI: Nun gibt es endlich eine Definition – und damit interessante Erkenntnisse zu OpenAI und Co.

Open Source AI-Models for Europe: Teuken 7B – Training on >50% non English Data.

Open Source AI: Common Corpus als größte offene Trainingsdatenbank veröffentlicht.

Open Source: Nextcloud-Assistent und Künstliche Intelligenz (KI).

Digitale Souveränität: Europa, USA und China im Vergleich

Fratini, S., Hine, E., Novelli, C. et al. Digital Sovereignty: A Descriptive Analysis and a Critical Evaluation of Existing Models. DISO 3, 59 (2024). https://doi.org/10.1007/s44206-024-00146-7

Digitale Souveränität ist ein Begriff, der in den verschiedenen Regionen der Welt durchaus unterschiedlich interpretiert wird. In Deutschland hat beispielsweise das Bundesministerium des Innern den Begriff in einer Veröffentlichung zum Thema wie folgt beschrieben:

„Digitale Souveränität beschreibt die Fähigkeiten und Möglichkeiten von Individuen und Institutionen, ihre Rolle(n) in der digitalen Welt selbstständig, selbstbestimmt und sicher ausüben zu können“ (Bundesministerium des Inneren (2020): Digitale Souveränität).

In der Europäischen Union gibt es Initiativen, die den Sovereign Workplace mit Open Source Anwendungen propagieren, da die kommerziellen, marktgetriebenen Anwendungen (bis hin zur Künstlichen Intelligenz) durchaus kritisch gesehen werden. Der Grund dafür liegt u.a. auf der Argumentation, dass gute Trainingsdaten für Künstliche Intelligenz nur zu bekommen sind, wenn die Urheberrechte “nicht so genau” genommen werden. Common Corpus zeigt allerdings genau das Gegenteil.

In einem Paper haben nun Fratini et al. (2024) die verschiedenen Perspektiven auf die Digitale Souveränität von verschiedenen Ländern in einer Grafik positioniert, in der es die Pole Hard Regulation >< Soft Regulation bzw. Domestic State Control >< Geopolitical Competition gibt (siehe Abbildung). Wie zu erkennen ist, liegen die USA im marktorientierten Bereich und China eher im staats-dominierten Sektor.

Die Europäische Union favorisiert eher einen rechte-basierten Ansatz und versucht, dem mit verschiedenen Grundsatz-Veröffentlichungen, wie dem EU Artificial Intelligence Act, gerecht zu werden. Die Autoren weisen berechtigt darauf hin, dass es eine einheitliche europäische Positionierung zur Digitalen Souveränität bisher nicht gibt, da die nationalen Regelungen noch kein einheitliches Bild ergeben. Dennoch ist durchaus ein Trend zu erkennen.

Meines Erachtens ist der von der Europäischen Union eingeschlagene Weg richtig. Es zeigt sich gerade in der Nutzung von mehr Open Source Anwendungen, dass es eine lebenswertere Alternative zu den amerikanischen oder chinesischen Vorgehen gibt – gerade im Sinne einer menschenzentrierten Society 5.0.

Souveränitätsscore: Zoom und BigBlueButton im Vergleich

Quelle: Prof. Wehnes https://digital-sovereignty.net/page-rating/video-conferencing
(Eigene farbige Hervorhebung)

Der in der Überschrift angesprochene Souveränitätsscore basiert auf der Überlegung einer Digitalen Souveränität von Staaten, Unternehmen/Organisationen und einzelnen Personen. Dazu muss natürlich erst einmal geklärt werden, was unter Digitaler Souveränität zu verstehen ist.

Digitale Souveränität beschreibt die Fähigkeiten und Möglichkeiten von Individuen und Institutionen, ihre Rolle(n) in der digitalen Welt selbstständig, selbstbestimmt und sicher ausüben zu können“ (Bundesministerium des Inneren (2020): Digitale Souveränität).

Daran anschließend sollten Kriterien festgelegt werden, anhand derer der Grad der Digitalen Souveränität bestimmt werden. Jäger, J. (2023) hat dazu Kriterien vorgeschlagen:

– Hat die Software eine Monopolstellung?
– Nutzt die Software eine quelloffene Lizenz?
– Werden offene, standardisierte Dateiformate unterstützt?
– Nutzt die Software offene APIs/Schnittstellen?
– Hat der Anbieter der Software seinen juristischen Hauptsitz in der EU?
– Kann die Software im eigenen Rechenzentrum betrieben werden?

Prof. Wehnes hat auf Basis dieser Überlegungen einen Souveränitätsscore ermittelt, der auf der Website https://digital-sovereignty.net bestimmt werden kann. In der Abbildung weiter oben sehen Sie beispielhaft den Souveränitätsscore von Zoom: 0,2 und den von BigBlueButton: 0,8.

Es ist deutlich zu erkennen, dass BigBlueButton die Anforderungen an die Digitale Souveränität erheblich besser erfüllt als Zoom.

Auf der genannten Website von Prof. Wehnes finden Sie noch weitere Vergleiche und ergänzende Informationen.

Wir nutzen auf unserer Kollaborationsplattform aus den ober erwähnten Gründen BigBlueButton und andere Open Source Anwendungen wie Moodle, Nextcloud, OpenProject, WordPress usw. – in Zukunft auch zusammen mit einer ethischen KI. Siehe dazu auch Künstliche Intelligenz: Vorteile von Open-Source-Modellen.