Microsoft LINGUA: KI soll Europas Sprachenvielfalt verstehen lernen
06.02.2026 - 08:32:12Microsoft investiert in offene Datensätze für 16 unterrepräsentierte europäische Sprachen und Dialekte. Die Initiative soll die wachsende Kluft zwischen KI und Millionen von Sprechern schließen.
Mit dem Programm LINGUA adressiert der Tech-Riese ein drängendes Problem: Künstliche Intelligenz versteht oft nur Englisch. Elf ausgewählte Projekte in zehn Ländern erhalten nun Unterstützung, um frei verfügbare Sprach- und Textdaten für KI-Modelle zu erstellen. Ziel ist es, über 65 Millionen Europäern einen gerechteren Zugang zu digitalen Chancen zu ermöglichen.
Die digitale Sprachbarriere überwinden
Die rasante Entwicklung generativer KI hat ein massives Ungleichgewicht offengelegt. Die Systeme werden hauptsächlich mit englischen Daten trainiert. Für Sprecher von Sprachen mit geringen digitalen Ressourcen – von Baskisch bis zu regionalen Dialekten – bedeutet das schlechtere KI-Leistungen und kulturelle Fehlanpassungen. Eine neue digitale Kluft droht.
Ein interner Microsoft-Bericht bestätigt den Zusammenhang: In Ländern mit „low-resource“-Sprachen ist die KI-Nutzung selbst bei vergleichbarem Wohlstand und Internetzugang deutlich geringer. LINGUA setzt genau hier an. Die Initiative schafft die grundlegende Dateninfrastruktur, damit Entwickler gerechtere und effektivere KI-Werkzeuge für den gesamten europäischen Markt bauen können.
Viele europäische Projekte zur Erstellung offener Datensätze unterschätzen inzwischen die Pflichten der EU‑KI‑Verordnung. Wer Sprach‑ und Audio‑Datensätze publiziert, muss Risikoklassen bestimmen, Transparenzdokumente erstellen und Nachweise zur Datenerhebung vorlegen. Ein kostenloses E‑Book erklärt kompakt, wie Entwickler, Universitäten und NGOs ihre KI‑Projekte rechtskonform aufsetzen, welche Kennzeichnungspflichten gelten und welche Fristen jetzt wichtig sind. Praxisnah, ohne Juristenkauderwelsch. Jetzt den kostenlosen KI‑Verordnungs‑Leitfaden herunterladen
Ein Bündnis für die Sprachvielfalt
Die elf geförderten Projekte bilden ein paneuropäisches Netzwerk. Universitäten, Nichtregierungsorganisationen, Kulturinstitute, ein staatliches Sprachzentrum und ein öffentlich-rechtlicher Sender arbeiten zusammen. Diese breite Koalition soll hochwertige und ethisch einwandfreie Datensätze in Text und Sprache generieren.
Unter den Teilnehmern ist auch das Department of Computational Linguistics der Universität Zürich. Alle entstehenden Daten werden unter eine offene Lizenz gestellt. Der Nutzen soll so über Microsoft hinausgehen und ein inklusiveres Open-Source-Ökosystem für KI in Europa stärken.
Ein Schritt zu digitaler Souveränität
Die LINGUA-Initiative ist Teil von Microsofts EU Digital Unlock-Programm und fügt sich in Europas Bestreben nach digitaler Souveränität ein. Indem in die linguistische Vielfalt investiert wird, soll sichergestellt werden, dass die KI-Transformation europäische Werte und Kontexte widerspiegelt.
Das Projekt wird in enger Abstimmung mit anderen europäischen Vorhaben wie dem APERTUS-Projekt der ETH Zürich und der EPFL sowie dem Europarat durchgeführt. Für globale Technologiekonzerne werden solche Initiativen immer wichtiger. KI, die die Nuancen lokaler Sprachen und Kulturen nicht versteht, kann weder europäische Unternehmen noch Bürger vollumfänglich bedienen.
Ausblick: Mehrsprachige KI als Wirtschaftstreiber
Mit der Bekanntgabe der Förderempfänger beginnt die praktische Arbeit. In den kommenden Monaten starten die Projekte mit der Datensammlung und -aufbereitung. Die offenen Datensätze sollen die Leistung und Fairness von KI-Modellen für Millionen Nutzer spürbar verbessern.
Langfristig könnte LINGUA die Eintrittsbarriere für lokale Entwickler und Start-ups senken. Das könnte die wirtschaftliche Innovation mit KI in ganz Europa befeuern und sicherstellen, dass die Vorteile der KI-getriebenen Wirtschaft breiter verteilt werden. Die Initiative setzt damit einen Maßstab für die gesamte Tech-Branche.
PS: Die EU‑KI‑Verordnung ist seit August 2024 in Kraft – viele Initiativen übersehen Übergangsfristen und Dokumentationspflichten, die Bußgelder nach sich ziehen können. Dieser kostenlose Umsetzungsleitfaden fasst übersichtlich zusammen, welche Anforderungen für offene Sprachdaten, Lizenzierung und Modell‑Dokumentation gelten, und liefert eine Checkliste für Projektstarter. Ideal für Forschungsteams und Tech‑Partner, die LINGUA‑ähnliche Vorhaben planen. Jetzt kostenlosen Umsetzungsleitfaden zur KI‑Verordnung sichern


