Künstliche Intelligenz 07.07.2025, 17:30 Uhr

Zwischen den Zeilen: Wie KI das Lesen lernt

Eine neue Studie beleuchtet den Lernprozess von KI-Sprachmodellen. Die Forschenden zeigen, wie neuronale Netze ihre Strategien zum Textverständnis während des Trainings grundlegend verändern – vom anfänglichen Fokus auf Wortpositionen hin zu einem tieferen Verständnis der Wortbedeutungen. Dieser Übergang ähnelt erstaunlicherweise einem Phasenübergang in der Physik.

Grafik eines Chips mit AI-Beschriftung.

KI kann auf verschiedene Arten Texte erfassen.

Foto: SmarterPix/kaptn

Die sprachlichen Fähigkeiten moderner KI-Systeme wie ChatGPT, Gemini und vieler anderer sind inzwischen beachtlich. Die Modelle können natürliche Konversationen führen und demonstrieren dabei ein Maß an Wortgewandtheit, das dem eines Menschen immer näherkommt. Aber trotz dieser Leistungen ist das Verständnis über die internen Prozesse, die in den neuronalen Netzen ablaufen und zu diesen Ergebnissen führen, noch begrenzt. Eine aktuelle Studie, veröffentlicht im Journal of Statistical Mechanics: Theory and Experiment (JSTAT), präsentiert nun neue Ergebnisse zu dem speziellen Aspekt des Lernprozesses dieser Systeme.

Wie verlässlich ist KI? TU Wien macht Unsicherheit berechenbar

Das Forscherteam entdeckte, dass sich Strategien zum Textverständnis der neuronalen Netze während des Trainings immer wieder verändern. Zu Beginn, wenn das Modell nur mit einer begrenzten Datenmenge trainiert wird, verlässt es sich hauptsächlich auf die Position der Wörter in einem Satz, um deren Beziehungen und Funktionen zu erschließen. Sobald jedoch eine kritische Schwelle an Trainingsdaten überschritten wird, vollzieht das System einen abrupten Wechsel hin zu einer Strategie, die auf der Bedeutung der Wörter basiert. Dieser Übergang ähnelt einem bestimmten Phasenübergang in physikalischen Systemen.

So lernen KI-Modelle das Lesen

Der Lernprozess eines neuronalen Netzes weist zudem Parallelen dazu auf, wie Kinder das Lesen erlernen. Über die Positionen der Wörter kann es ableiten, ob ein Wort Subjekt, Verb oder Objekt ist. Mit fortschreitendem Training – das Netzwerk „geht weiter zur Schule“ – findet jedoch die genannte Verschiebung statt: Die Bedeutung der Wörter rückt in den Vordergrund und wird zur primären Informationsquelle für das Textverständnis.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
FFG Flensburger Fahrzeugbau Gesellschaft mbH-Firmenlogo
Konstrukteur (m/w/d) - Elektromechanik FFG Flensburger Fahrzeugbau Gesellschaft mbH
Flensburg Zum Job 
TÜV Technische Überwachung Hessen GmbH-Firmenlogo
Ausbildung Prüfingenieur/-in (m/w/d) bzw. Sachverständige/-r (m/w/d) für den Tätigkeitsbereich Fahrzeugprüfung und Fahrerlaubnisprüfung TÜV Technische Überwachung Hessen GmbH
Schlüchtern Zum Job 
swa Netze GmbH-Firmenlogo
Elektroingenieur (m/w/d) Einspeiseanlagen mit Führungsperspektive swa Netze GmbH
Augsburg Zum Job 
WBS TRAINING-Firmenlogo
Lernbegleiter:in / Trainer:in für SPS-Programmierung (m/w/d) WBS TRAINING
Deutschland / Homeoffice Zum Job 
Netzgesellschaft Potsdam GmbH-Firmenlogo
Ingenieur (m/w/d) Strategische Netzplanung - Strom Netzgesellschaft Potsdam GmbH
Potsdam Zum Job 
Netzgesellschaft Potsdam GmbH-Firmenlogo
Projektleiter / Bauleiter (m/w/d) Netzbau und Anlagenbau Strom Netzgesellschaft Potsdam GmbH
Potsdam Zum Job 
Karlsruher Institut für Technologie (KIT)-Firmenlogo
Leiterin / Leiter Projektträgerschaft "Projektgeförderte Endlagerforschung" (w/m/d) Karlsruher Institut für Technologie (KIT)
Eggenstein-Leopoldshafen Zum Job 
General Aerospace GmbH-Firmenlogo
Industrial Engineer (w/m/d) General Aerospace GmbH
Eschbach Zum Job 
Hochschule Heilbronn-Firmenlogo
Professur für angewandte KI im Wirtschaftsingenieurwesen Hochschule Heilbronn
Heilbronn Zum Job 
Honda R&D Europe (Deutschland) GmbH-Firmenlogo
Entwicklungsingenieur (m/w/d) Fahrdynamik, Fahrversuch und Simulation Honda R&D Europe (Deutschland) GmbH
Offenbach am Main Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
TenneT TSO GmbH-Firmenlogo
Sachbearbeiter für Wandler in Umspannwerken (m/w/d) TenneT TSO GmbH
DICO Drinks GmbH-Firmenlogo
Projektmanager - Betriebsengineering (m/w/d) DICO Drinks GmbH
Hückelhoven Zum Job 
Emscher Lippe Energie GmbH-Firmenlogo
Teamleiter operativer Messstellenbetrieb (m/w/d) Emscher Lippe Energie GmbH
Gelsenkirchen Zum Job 
Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH-Firmenlogo
Konstruktionsingenieur:in EPLAN (d/m/w) Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH
Frankfurt am Main Zum Job 
PFISTERER Kontaktsysteme GmbH-Firmenlogo
Entwicklungsingenieur Hochspannungstechnik - HVDC (m/w/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
Müller & Bleher Ulm GmbH & Co. KG-Firmenlogo
Projektleiter Elektrotechnik / Stromversorgung (m/w/d) Müller & Bleher Ulm GmbH & Co. KG
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in / Projektmanager*in (m/w/d) in der Steuerung von Großprojekten im Bereich Energiewende THOST Projektmanagement GmbH
Ostbayerische Technische Hochschule Amberg-Weiden (OTH)-Firmenlogo
Professur (m/w/d) der BesGr. W2 für das Lehrgebiet Solarenergie und Gebäudeautomation Ostbayerische Technische Hochschule Amberg-Weiden (OTH)
Wirtgen GmbH-Firmenlogo
Functional Safety Software Engineer (m/w/d) - für mobile Arbeitsmaschinen Wirtgen GmbH
Windhagen Zum Job 

Die Wissenschaftlerinnen und Wissenschaftler untersuchten diesen Übergang anhand eines vereinfachten Modells des sogenannten Selbstaufmerksamkeitsmechanismus‘, bei dem es sich um ein Kernelement von Transformer-Sprachmodellen handelt. Diese Mechanismen sind darauf spezialisiert, Beziehungen innerhalb eines Textes zu erfassen, indem sie die Bedeutung einzelner Wörter im Kontext der anderen bewertet. „Um die Beziehungen zwischen den Wörtern zu evaluieren“, erläutert Studienautor Hugo Cui, „kann das Netzwerk zwei verschiedene Strategien anwenden, von denen eben eine das Nutzen der Wortpositionen ist.“

Der Übergang von positionsbasiertem zu bedeutungsorientiertem KI-Lernen

Die Wissenschaftlerinnen und Wissenschaftler beobachteten, dass sich zunächst spontan die positionsbasierte Strategie einstellt, wenn das Netz trainiert wird. Ein einfaches Beispiel hierfür ist die typische Subjekt-Verb-Objekt-Reihenfolge wie in „Mary isst den Apfel“. Doch bei fortgesetztem Training, bei dem das System immer mehr Daten zur Verfügung gestellt bekommt, geschieht das Überraschende: Ab einem bestimmten Punkt wechselt die Strategie abrupt und das Netzwerk beginnt, sich auf die Wortbedeutungen zu verlassen.

„Wir wollten ursprünglich einfach untersuchen, welche Strategien oder Strategiemischungen die Netze anwenden würden“, sagt Cui. „Stattdessen fanden wir heraus, dass sich das Netzwerk unterhalb eines bestimmten Schwellenwerts ausschließlich auf die Position verließ, während es oberhalb dieses Schwellenwerts nur noch auf die Bedeutung setzte.“ Dieser Wechsel wird als Phasenübergang beschrieben – angelehnt an das Konzept bekannt aus der Physik.

Ein Phasenübergang im KI-Lernen

Die statistische Physik befasst sich mit Systemen aus enorm vielen Teilchen, indem sie deren kollektives Verhalten statistisch beschreibt. Neuronale Netze  bestehen ähnlich wie diese Systeme aus einer Vielzahl von „Neuronen“, die einfache Operationen ausführen und deren Interaktion zur Intelligenz des Systems führt. Eine abrupte Änderung des Netzwerkverhaltens kann daher als Phasenübergang betrachtet werden – vergleichbar mit der Verwandlung von Wasser in Gas unter bestimmten Bedingungen.

„Aus theoretischer Sicht ist es wichtig zu verstehen, dass der Strategiewechsel auf diese Weise stattfindet“, sagt Cui. Obwohl die untersuchten Netzwerke im Vergleich zu komplexen KI-Modellen vereinfacht sind, können sie Hinweise darauf geben, unter welchen Bedingungen sich ein Modell auf die eine oder andere Strategie fokussiert. Dieses theoretische Wissen könnte zukünftig genutzt werden, um den Einsatz neuronaler Netze effizienter und sicherer zu gestalten.

Ein Beitrag von:

  • Julia Klinkusch

    Julia Klinkusch ist seit 2008 selbstständige Journalistin und hat sich auf Wissenschafts- und Gesundheitsthemen spezialisiert. Seit 2010 gehört sie zum Team von Content Qualitäten. Ihre Themen: Klima, KI, Technik, Umwelt, Medizin/Medizintechnik.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.