Ein Bauteil, das lernt und vergisst: Forscher bauen KI-Hardware nach dem Vorbild des Gehirns
Ein neuer Phototransistor aus Oregon speichert und verarbeitet Information am selben Ort wie eine Synapse. Das könnte den größten Energiefresser klassischer KI-Hardware umgehen.
Anders als bisherige Chips "rechnet" dieser Speicher direkt mit seinen Daten ohne zusätzlichen Prozessor.
Foto: Oregon State University
Die Entwicklung klingt simpel, doch wer sie versteht, erkennt ihr Potenzial: Ein Forschungsteam der Oregon State University hat einen Transistor entwickelt, der nicht nur Information speichert, sondern diese auch zugleich verarbeiten kann.
Angelehnt ist die Funktionsweise an die Neuronen im Gehirn. Unser menschlicher „Bio-Computer“ arbeitet jedoch fundamental anders als reguläre Computer – vor allem effizienter.
Inhaltsverzeichnis
Künstliche Intelligenz ahmt die Logik des Gehirns auf dem Computer nach. Zum Training von KI-Modellen auf regulären Computern werden jedoch riesige Energiemengen gebraucht.
Das ist ein Problem. Doch was, wenn Energiekosten deutlich reduziert werden könnten, wenn auch die Hardware dem Gehirn ähnlicher wird? US-Forschende kombinieren nun Licht und Strom in einem Bauteil, das sowohl lernen wie auch vergessen kann.
Was unterscheidet diesen Transistor von denen im klassischen Computer?
In normalen Computern sind Speicher und Prozessor getrennt, was als Von-Neumann-Architektur bezeichnet wird. Ein heutiges Bauteil ist also in der Regel entweder eines zur Datenspeicherung oder eines zur Datenverarbeitung.
Das neue Bauteil aus Oregon kann aber beides parallel und arbeitet sowohl mit Licht als auch Strom. Dieser hybride „Phototransistor“ wird einerseits über seine lichtempfindliche Polymerschicht durch Lichtimpulse gesteuert. Andererseits ist es ein „Hybrid“, da der Transistor über seine Metalloxid-Schicht auch Strom regelt.
Wenn nun ein Lichtblitz auf die Polymerschicht des neuartigen Bauteils trifft, verbleibt dort ein positiv geladenes „Ladungsloch“, während die vom Licht freigesetzten Elektronen über das Metalloxid abfließen. Die positive Ladung bleibt also nicht nur im Polymer gespeichert, sie verstärkt auch den Stromfluss im Halbleiter. Weitere Lichtblitze verstärken die Ladung und damit den Stromfluss, der Transistor „lernt“. Das Prinzip ist das Gleiche wie bei den Synapsen im Gehirn.
Warum wird KI durch solche Bauteile effizienter?
Wenn wir unsere Computer nutzen – zum Beispiel, um ein Video schneiden ‑ müssen immer Daten zwischen dem Speicher und dem Prozessor hin- und her übertragen werden, um sie zu verarbeiten. Das kostet jedes Mal Zeit und Strom. Dieser aufwendige Vorgang ist in Fachkreisen berüchtigt und wird „von-Neumann-Flaschenhals“ genannt. Er bremst Effizienz und Leistung selbst der modernsten Rechner.
Anders ist es im Gehirn. Hier liegen Speicher und Verarbeitung zusammen. Wenn wir etwas Neues lernen oder belohnt werden, verändert sich unser Gehirn. Es baut dann zusätzliche Rezeptoren in die Synapsen zwischen den Nerven ein, die bei der Verarbeitung benutzt wurden. Dadurch wird die Signalübertragung stärker. Die „Daten“ liegen also in der Stärke der Verbindungen zwischen Nerven, in den Synapsen. Sie müssen nicht für jede Verarbeitung neu aus einem Speicher geladen werden.
Das Forschungsfeld, neben der Verarbeitungs-Logik auch die Hardware „gehirnähnlicher“ und damit leistungsfähiger oder effizienter zu machen, nennt sich „neuromorphes Computing.“
Wie rechnet dieser hybride Photo-Transistor?
Die aufwendigste Rechenoperation in neuronalen Netzen ist die sogenannte „Multiply-Accumulate“-Operation. Der Multiplikationsteil läuft so:
- Eine Eingangsspannung wird mit einem Gewichtungsfaktor multipliziert, der bei diesem Transistor durch die gespeicherte, kumulierte positive Ladung bestimmt ist.
- Anschließend müssen mehrere dieser „Neuronen“ lediglich noch parallel verschaltet werden, damit sich die Ausgangsspannungen aufsummieren.
Die Gewichtungen sind dabei direkt im Transistor gespeichert. Es braucht keine aufwendigen Datentransfers, und deshalb gibt es keinen von-Neumann-Flaschenhals mehr. Speicherung und Berechnung finden an einem Ort statt.
Kann das Bauteil auch vergessen?
Im „Lernmodus“ ist die sogenannte Gate-Spannung des Transistors negativ. Die Stärke der Spannung bestimmt, ob die positiven Ladungslöcher in der Polymerschicht stabil gespeichert werden, oder so, dass ihr Wert mit der Zeit abnimmt. Das Bauteil hat also ein Langzeit- und ein Kurzzeitgedächtnis.
Wird die Gate-Spannung positiv, füllen sich alle Ladungslöcher wieder auf und das Bauteil-Gedächtnis wird gelöscht. Das Bauteil kann dann wieder neu angelernt werden.
Hier finden Sie die Originalpublikation für weitere Informationen.
Ein Beitrag von: