Dieser Hirn-inspirierte Chip könnte das Energieproblem der KI lösen
Cambridge entwickelt einen hirn-inspirierten Memristor, der den Energieverbrauch von KI-Hardware deutlich senken könnte.
Dr. Babak Bakhit von der University of Cambridge arbeitet an einem neuartigen Memristor, der das Daten-Pingpong in KI-Chips reduzieren und so Strom sparen könnte.
Foto: Babak Bakhit
KI frisst Strom. Nicht nur ein bisschen, sondern immer mehr. Mit jedem größeren Modell, jedem neuen Rechenzentrum und jeder zusätzlichen Anwendung wächst der Energiebedarf. Das liegt nicht nur an der Software. Das eigentliche Problem sitzt tiefer, nämlich in der Hardware.
Denn heutige KI-Chips folgen meist noch einem alten Prinzip: Sie rechnen an einer Stelle und speichern Daten an einer anderen. Zwischen beiden Bereichen werden Informationen ständig hin- und hergeschoben. Genau dieses Daten-Pingpong kostet viel Energie.
Ein Forschungsteam der University of Cambridge will das ändern. Die Forschenden haben ein nanoelektronisches Bauteil entwickelt, das sich am menschlichen Gehirn orientiert. Es handelt sich um einen neuen Memristor auf Basis von Hafniumoxid.
Solche Bauteile gelten seit Jahren als Kandidaten für neuromorphe Hardware, also für Chips, die eher wie Nervenzellen und Synapsen arbeiten als wie klassische Prozessoren. Der entscheidende Unterschied: Speicher und Rechnen rücken näher zusammen. Das verkürzt Datenwege und könnte den Stromverbrauch deutlich senken.
Inhaltsverzeichnis
- Das eigentliche Problem der KI liegt im Datentransport
- Memristoren gelten als Hoffnungsträger und als Problemfall
- Hafniumoxid mit Zusätzen verändert das Schaltverhalten
- Eine Million Mal niedrigere Ströme
- Der Chip kann sogar eine Lernregel aus der Biologie nachbilden
- Noch ist das keine Lösung für morgen
Das eigentliche Problem der KI liegt im Datentransport
Viele Debatten über KI drehen sich um Modelle, Trainingsdaten und Rechenzentren. Technisch ist aber noch eine andere Frage zentral: Wie effizient verarbeitet ein Chip die Daten, die er ständig bewegen muss?
Klassische Rechner folgen der sogenannten Von-Neumann-Architektur. Dabei sind Recheneinheit und Speicher getrennt. Für viele Anwendungen ist das beherrschbar. Bei KI wird es teuer. Große Modelle müssen gewaltige Datenmengen permanent verschieben. Das kostet Rechenleistung und Strom. Gerade bei neuronalen Netzen ist das ein struktureller Nachteil.
Neuromorphes Rechnen setzt deshalb an einem anderen Punkt an. Informationen sollen möglichst dort verarbeitet werden, wo sie gespeichert sind. Laut Cambridge könnte dieser Ansatz den Energiebedarf solcher Systeme um bis zu 70 % senken. Diese Zahl sollte man allerdings sauber einordnen: Sie beschreibt das Potenzial der Architektur, nicht die bereits nachgewiesene Einsparung eines marktreifen Produkts. Wer darin schon die Lösung für alle KI-Rechenzentren sieht, greift zu kurz.
Memristoren gelten als Hoffnungsträger und als Problemfall
Memristoren sind elektronische Bauteile, deren Widerstand sich gezielt verändern und speichern lässt. Genau das macht sie für KI-Hardware interessant. Sie können nicht nur Daten ablegen, sondern auch Rechenoperationen direkt im Speicher unterstützen. Fachleute sprechen hier von „In-Memory-Computing“.
Das Problem: Viele bisherige Memristoren arbeiten mit winzigen leitfähigen Filamenten im Material. Diese entstehen beim Schalten und reißen später wieder auf. In der Theorie funktioniert das. In der Praxis sind solche Prozesse oft schwer kontrollierbar. Die Bauteile schalten dann nicht immer gleich, altern ungleichmäßig oder benötigen vergleichsweise hohe Spannungen. Für große Arrays mit Millionen Zellen ist das ein ernstes Problem.
Genau hier setzt die neue Arbeit aus Cambridge an. Das Team verfolgt keinen filamentären Ansatz, sondern ein Schalten an Grenzflächen im Material. Statt leitfähige Fäden wachsen und wieder verschwinden zu lassen, verändert das Bauteil die Höhe einer Energiebarriere an einer internen Grenzfläche. Vereinfacht gesagt: Der Stromfluss wird gezielter geregelt, statt auf ein schwer kontrollierbares Filament angewiesen zu sein.
Hafniumoxid mit Zusätzen verändert das Schaltverhalten
Das Material selbst ist kein Exot. Hafniumoxid ist in der Halbleitertechnik gut bekannt. Interessant wird es hier durch den konkreten Aufbau. Die Forschenden ergänzten das Hafniumoxid mit Strontium und Titan und erzeugten die Schicht in einem zweistufigen Verfahren. Auf diese Weise bildeten sich im Inneren des Oxids kleine p-n-Übergänge an den Schichtgrenzen. Sie prägen das Schaltverhalten des Bauteils.
Hauptautor Dr. Babak Bakhit sagt: „Der Energieverbrauch ist eine der größten Herausforderungen bei der aktuellen KI-Hardware.“ Er ergänzt: „Um dieses Problem zu lösen, benötigt man Bauteile mit extrem niedrigen Stromstärken, ausgezeichneter Stabilität, hoher Gleichmäßigkeit über Schaltzyklen und Bauteile hinweg sowie der Fähigkeit, zwischen vielen verschiedenen Zuständen zu wechseln.“
Eine Million Mal niedrigere Ströme
Nach Angaben des Teams lagen die Schaltströme der neuen Bauteile etwa eine Million Mal niedriger als bei einigen herkömmlichen oxidbasierten Ansätzen. Außerdem erzeugten die Memristoren Hunderte stabile Leitfähigkeitsstufen. Beides zusammen ist für neuromorphe Systeme interessant, weil sich damit der Energiebedarf senken und analoges Rechnen besser abbilden lässt.
Hinzu kommt ein weiterer Punkt: Die Bauteile arbeiteten im Labor relativ gleichmäßig – sowohl von Schaltzyklus zu Schaltzyklus als auch von Bauteil zu Bauteil. Genau diese Gleichmäßigkeit fehlt vielen anderen Konzepten. Bakhit sagt dazu: „Filamentäre Bauelemente weisen ein zufälliges Verhalten auf.“ Und weiter: „Da unsere Bauelemente an der Grenzfläche schalten, zeigen sie eine hohe Gleichmäßigkeit von Zyklus zu Zyklus und von Bauelement zu Bauelement.“
Der Chip kann sogar eine Lernregel aus der Biologie nachbilden
Die Cambridge-Bauteile zeigten laut Team außerdem eine Form der sogenannten spike-timing-abhängigen Plastizität. Dahinter steckt eine Lernregel, die auch in biologischen Nervensystemen eine Rolle spielt. Vereinfacht gesagt: Die Stärke einer Verbindung hängt davon ab, wie eng zwei Signale zeitlich aufeinander folgen. Treffen sie passend ein, wird die Verbindung gestärkt. Treffen sie unpassend ein, wird sie geschwächt.
Für klassische Rechner ist das kein natürlicher Betriebsmodus. Für neuromorphe Hardware dagegen schon. Genau deshalb ist dieser Punkt mehr als ein akademisches Detail. Er zeigt, dass das Bauteil nicht nur speichern, sondern auch eine einfache Form lernähnlichen Verhaltens technisch nachbilden kann. Bakhit formuliert das so: „Das sind die Eigenschaften, die Sie benötigen, wenn Sie Hardware wollen, die lernen und sich anpassen kann, anstatt nur Daten zu speichern.“
Noch ist das keine Lösung für morgen
So sauber die Ergebnisse klingen: Von einem fertigen KI-Chip ist die Forschung noch entfernt. Das größte Problem ist derzeit die Herstellung. Der Prozess benötigt Temperaturen von rund 700 °C. Das ist für viele Standardprozesse in der Halbleiterfertigung zu hoch – vor allem dann, wenn sich die Bauteile später mit bestehender CMOS-Technologie kombinieren lassen sollen.
Bakhit sagt: „Das ist derzeit die größte Herausforderung bei unserem Fertigungsprozess.“ Und weiter: „Wir arbeiten jedoch derzeit daran, die Temperatur zu senken, um den Prozess besser mit branchenüblichen Verfahren kompatibel zu machen.“
Ein Beitrag von: