Künstliche Intelligenz hält Drohnen stabil im Sturm
MIT entwickelt lernfähige Drohnensteuerung: Stabiler Flug trotz Wind durch Meta-Learning und geometrisch optimierte Algorithmen.

Starker Wind machte es Drohnen bisher schwer, der festgelegten Route zu folgen. Ein neuer Ansatz könnte das künftig ermöglichen.
Foto: PantherMedia / cloudvisual (YAYMicro)
Drohnen werden heute nicht nur für Filmaufnahmen oder Lieferdienste eingesetzt. Sie kommen auch bei Rettungsmissionen, in der Landwirtschaft oder im Katastrophenschutz zum Einsatz – oft unter schwierigen Bedingungen. Besonders Wind stellt eine große Herausforderung dar. Ein neues Steuerungssystem des MIT verspricht Abhilfe: Es lernt, sich selbst zu stabilisieren – auch bei unbekannten Windverhältnissen.
Inhaltsverzeichnis
Wenn der Wind die Kontrolle übernimmt
Stellen Sie sich eine autonome Drohne vor, die Wasser über einem Waldbrand in Kalifornien abwirft. In der Luft trifft sie auf böige Santa-Ana-Winde, die unvorhersehbar ihre Flugbahn beeinflussen. Klassische Steuerungssysteme sind in solchen Situationen überfordert. Sie basieren meist auf festen Modellen und benötigen Vorkenntnisse über typische Störungen.
Das neue System, das Forschende am Massachusetts Institute of Technology (MIT) entwickelt haben, verfolgt einen anderen Ansatz. Es lernt aus Daten, nicht aus vorgegebenen Regeln. Die Drohne erkennt selbstständig, wie sie auf Wind reagieren muss – noch während sie fliegt.
Lernen zu lernen: Meta-Learning als Kern
Im Zentrum steht ein Verfahren namens Meta-Learning. Es bedeutet wörtlich: Lernen zu lernen. Statt auf eine bestimmte Situation trainiert zu werden, übt das System an vielen ähnlichen Aufgaben. Beispielsweise lernt es bei verschiedenen Windstärken, wie es optimal stabil bleiben kann.
„Unsere Methode kann mit unterschiedlichen Zielen umgehen, da wir mithilfe von Meta-Lernen aus Daten effizient eine gemeinsame Darstellung für verschiedene Szenarien lernen können“, erklärt Sunbochen Tang, einer der beteiligten Doktoranden.
So entsteht eine Art Erfahrungsschatz, auf den die Drohne bei neuen Störungen zurückgreifen kann – ohne komplett neu programmiert zu werden.
Meta-Learning bedeutet wörtlich „Lernen zu lernen“. Dabei wird ein Algorithmus nicht nur für eine bestimmte Aufgabe trainiert, sondern für viele ähnliche – etwa unterschiedliche Windverhältnisse. Aus diesen Erfahrungen lernt das System, wie es in neuen, unbekannten Situationen schneller die passende Lösung findet.
Statt bei jedem Flug von Grund auf neu zu lernen, nutzt das System seine „Meta-Erfahrung“, um sich gezielt anzupassen. Diese Technik kommt vor allem bei Anwendungen zum Einsatz, die flexibel und robust auf wechselnde Umgebungen reagieren müssen – wie autonome Drohnen.
Spiegel statt Gradienten: Eine Frage der Geometrie
Ein weiteres zentrales Element ist der sogenannte „Mirror Descent“. Dabei handelt es sich um eine Erweiterung klassischer Optimierungsverfahren wie des Gradientenabstiegs. Diese Methoden berechnen, wie ein System seine Parameter schrittweise anpassen muss, um ein Ziel zu erreichen – etwa eine stabile Flugbahn.
Beim Mirror Descent geschieht dies aber nicht in einem euklidischen Raum, sondern in einer geometrisch angepassten Struktur. Diese spiegelt gewissermaßen die Eigenschaften der Störung wider – daher der Name.
Die Forschenden nutzen eine Auswahl verschiedener sogenannter Spiegelfunktionen, um für jede Situation den passenden Algorithmus zu finden. „Die Kunst besteht darin, den richtigen Algorithmus für das jeweilige Problem auszuwählen. Bei unserer Methode automatisieren wir diese Auswahl“, sagt Projektleiter Navid Azizan.
Mirror Descent ist ein Verfahren aus der Optimierung, das eine Alternative zum bekannten Gradientenabstieg darstellt. Während der klassische Gradientenabstieg Veränderungen im euklidischen Raum berechnet, nutzt Mirror Descent eine andere geometrische Perspektive.
Dabei wird der sogenannte „Spiegelraum“ verwendet, der die Struktur des Problems besser abbildet. So lassen sich auch bei komplexen oder verzerrten Daten effizientere Anpassungen vornehmen. Besonders hilfreich ist das Verfahren, wenn Systeme unter unsicheren Bedingungen lernen und sich anpassen müssen – etwa autonome Drohnen bei starkem Wind.
Daten statt Modelle
Das neuronale Netzwerk im Steuerungssystem ersetzt die klassische Modellierung potenzieller Störungen. Statt vorher festzulegen, wie sich Wind verhält, analysiert die Drohne die realen Daten während des Flugs. So lernt sie mit jeder Minute dazu – ohne dass ein Mensch nachjustieren muss.
In einer 15-minütigen Flugphase reichen die gesammelten Daten bereits aus, um sich auf neue Bedingungen einzustellen. Das System erkennt nicht nur, wie der Wind wirkt, sondern wählt gleichzeitig den besten Lernalgorithmus für die Situation aus.
Stabil trotz Sturm: Simulation zeigt Wirkung
In einem Experiment testete das Team die Methode mit einem digitalen Quadrokopter. Die Windgeschwindigkeit wurde systematisch verändert – von moderaten 2 m/s bis zu kräftigen 10 m/s. Das Ergebnis: Die Abweichung von der gewünschten Flugbahn war bei hohen Windgeschwindigkeiten um mehr als 50 % geringer als bei klassischen Steuerungen.
„Unsere Methode verallgemeinert besser, auch wenn die Störung außerhalb des gelernten Bereichs liegt“, schreiben die Autor*innen in ihrer Publikation.
Die Leistung stieg sogar mit zunehmender Windstärke. Das deutet darauf hin, dass sich das System besonders in extremen Umgebungen bewährt – wie bei Rettungseinsätzen oder dem Transport schwerer Lasten.
Praxisnähe: Tests im echten Wind
Derzeit läuft die Umsetzung in der realen Welt. Das Team testet die Steuerung mit echten Drohnen bei unterschiedlichen Windbedingungen. Ziel ist es, das System so weiterzuentwickeln, dass es auch mit komplexeren Störungen umgehen kann – etwa mit schwankenden Lasten während des Flugs.
Zudem wollen die Forschenden das System um eine Funktion zum kontinuierlichen Lernen erweitern. Dann könnte sich die Drohne selbst bei völlig neuen Bedingungen noch ohne Nachtraining anpassen.
Reaktion statt Voraussage
Im Gegensatz zu früheren Systemen geht es hier nicht darum, jede Eventualität im Vorfeld zu modellieren. Stattdessen beobachtet die Drohne ihre Umgebung, analysiert die Daten in Echtzeit – und reagiert.
„Das gleichzeitige Lernen dieser Komponenten macht die Stärke unserer Methode aus“, so Azizan. Der adaptive Regler passt sich nicht nur an neue Windverhältnisse an, sondern lernt auch, wie er lernen soll.
Ein Beitrag von: