Kommt Europas KI-Zukunft aus Hannover? Zumindest teilweise. Denn das Bundesministerium für Wirtschaft und Energie hat mit einer Förderung von 20 Millionen Euro das KI-Projekt „Soofi“ an den Start gebracht, bei dem Forschende ein offenes Sprachmodell nach europäischen Standards entwickeln wollen. Sechs Einrichtungen sind beteiligt – darunter das Forschungszentrum L3S an der Leibniz Universität Hannover.
„Soofi“ steht für „Sovereign Open Source Foundation Models for European Intelligence“. Damit will Europa unabhängiger werden von großen US-Unternehmen wie Google und OpenAI, dem Softwareunternehmen hinter ChatGPT. Denn bislang verfügt Europa kaum über KI-Sprachmodelle in ausreichender Größe. In Zahlen heißt das: Geplant ist ein Sprachmodell mit 100 Milliarden Parametern. Einfach ausgedrückt: Stellt man sich das KI-Modell als ein neuronales Netz ähnlich einem Gehirn vor, sind die Parameter die Verbindungen.
„Am Anfang ist alles zufällig verdrahtet und funktioniert noch nicht – das kommt erst durchs Training“, erklärt Professor Wolfgang Nejdl, geschäftsführender Direktor am Forschungszentrum L3S. Ein Modell mit 100 Milliarden Parametern sei mittelgroß, so Nejdl. „Damit kann man fast alles machen“, sagt er. Branchenriesen wie ChatGPT sind zwar deutlich größer, verbrauchen aber auch viel mehr Rechenkapazitäten.
Ein weiterer wichtiger Unterschied: Das „Soofi“-Modell soll open source, also offen sein. Es soll also transparent sein, mit welchen Daten die KI trainiert wurde – anders als bei ChatGPT und anderen bekannten Chatbots. Auch soll das Modell lokal betrieben werden können, damit die KI keine sensiblen Daten von Unternehmen oder Behörden für das weitere Training nutzen könne. Neben dem Datenschutz und regulatorischen Vorgaben soll die KI auch „europäische Werte“ berücksichtigen. Dabei gehe es einerseits um kulturelle Eigenheiten, die das Modell kennen solle, erklärt Nejdl. Andererseits nennt er zwei Negativbeispiele: Elon Musks KI-Chatbot Grok, der sich im Sommer antisemitisch äußerte und Hitler lobte, und die chinesische KI DeepSeek, die sich weigert, Fragen zum Tian’anmen-Massaker von 1989 zu beantworten.
Eingesetzt werden soll die europäische KI vor allem in der kritischen Infrastruktur wie Medizin, Bildung, Industrie oder auch der öffentlichen Verwaltung. „Der Consumerbereich ist nicht unser Ziel“, sagt Nejdl, auch wenn das Sprachmodell generell überall genutzt werden könne.
Bei der Entwicklung der KI werde das Team in drei Schritten vorgehen. „Wir fangen mit dem Basismodell an, das Wahrscheinlichkeiten lernt – also welche Worte in welchem Kontext folgen“, erklärt Nejdl. Als Nächstes folge das „Instruction Finetuning“, wobei die KI lerne, Fragen zu beantworten. In einem dritten Schritt solle aus dem einfachen Sprachmodell dann ein sogenanntes Reasoning-Modell entstehen.
Ein Reasoning-Modell antworte anders als herkömmliche KI-Chatbots nicht sofort, sondern „denke länger nach“ und suche auch in externen Informationsquellen, um komplexere Anfragen zu beantworten, erklärt Nejdl. Das Team am L3S sammle derzeit Datensätze und beginne im Frühjahr mit dem sechsmonatigen Training der neuen KI, erklärt er.
Projektpartner sind neben dem L3S aus Hannover die beiden Fraunhofer-Institute IAIS und IIS, das Deutsche Forschungszentrum für Künstliche Intelligenz, die Universität Würzburg, die TU Darmstadt, die Beuth-Hochschule Berlin und zwei Start-ups. Die Konsortialführung übernimmt der KI-Bundesverband.