Reasoning, Agenten, Vibe Coding 19.11.2025, 07:30 Uhr

Googles KI im Angriffsmodus: Was kann Gemini 3 besser?

Google startet mit Gemini 3 eine neue KI-Offensive: stärker im Reasoning, mit Agenten, Coding und neuer Plattform Antigravity. Was steckt dahinter?

Google Gemini

Google zündet mit Gemini 3 die nächste Stufe seiner KI-Offensive. Das Modell soll deutlich besser logisch denken, Code schreiben, mit Bildern und Videos umgehen – und als Agent eigenständig Aufgaben erledigen.

Foto: Smarterpix / rafapress

Google macht mit Gemini 3 klar, dass der Konzern im KI-Wettlauf nicht länger passiv reagieren will. Die neue Modellgeneration rückt näher an den Alltag, übernimmt komplexe Planungsschritte und schreibt Code, als säße eine ganze Entwicklungsabteilung im Hintergrund. Die KI soll nicht mehr wie ein Chatbot wirken, sondern wie eine Denk-Schicht, die über Anwendungen liegt und Aufgaben eigenständig strukturiert. Schauen wir uns Gemini 3 im Detail an.

Gemini 3 – Überblick in Kürze

  • Positionierung: Googles neues KI-Modell soll wieder an die Spitze im KI-Wettbewerb.
  • Kernstärken: besseres Reasoning, stärker im Programmieren, große Kontexte, multimodales Verständnis (Text, Bild, Video, Raum).
  • Integration: direkt in Google-Suche (KI-Modus), Gemini-App, Cloud-Dienste und Developer-Tools eingebaut.
  • Agenten-Plattform: Google Antigravity für KI-Agenten, die Softwareaufgaben planen, Code schreiben und den Browser steuern.
  • Modi:
    • Gemini 3 Pro: Basis für die meisten Produkte.
    • Deep Think: verstärktes Schlussfolgern, noch in Sicherheits-Tests.
  • Coding-Fähigkeiten: Vibe Coding, agentisches Coden, bessere Werte in Benchmarks (WebDev, SWE-bench).
  • Langzeitplanung: stabilere, mehrstufige Workflows und bessere Planung über längere Zeiträume.
  • Sicherheit: weniger anfällig für Prompt-Injections, verbesserter Schutz vor Missbrauch, externe Prüfungen.
  • Zielgruppen: Endnutzer*innen, Entwickler*innen und Unternehmen – jeweils mit eigenen Gemini-Varianten und APIs.

 

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
TenneT TSO GmbH-Firmenlogo
Sachbearbeiter für Wandler in Umspannwerken (m/w/d) TenneT TSO GmbH
DICO Drinks GmbH-Firmenlogo
Projektmanager - Betriebsengineering (m/w/d) DICO Drinks GmbH
Hückelhoven Zum Job 
Emscher Lippe Energie GmbH-Firmenlogo
Teamleiter operativer Messstellenbetrieb (m/w/d) Emscher Lippe Energie GmbH
Gelsenkirchen Zum Job 
Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH-Firmenlogo
Konstruktionsingenieur:in EPLAN (d/m/w) Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH
Frankfurt am Main Zum Job 
PFISTERER Kontaktsysteme GmbH-Firmenlogo
Entwicklungsingenieur Hochspannungstechnik - HVDC (m/w/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
Müller & Bleher Ulm GmbH & Co. KG-Firmenlogo
Projektleiter Elektrotechnik / Stromversorgung (m/w/d) Müller & Bleher Ulm GmbH & Co. KG
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in / Projektmanager*in (m/w/d) in der Steuerung von Großprojekten im Bereich Energiewende THOST Projektmanagement GmbH
WITTENSTEIN motion control GmbH-Firmenlogo
Systemingenieur (w/m/d) WITTENSTEIN motion control GmbH
Igersheim-Harthausen Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Sales Manager (m/w/i) Oberflächeninspektion IMS Messsysteme GmbH
Heiligenhaus Zum Job 
FFG Flensburger Fahrzeugbau Gesellschaft mbH-Firmenlogo
Konstrukteur (m/w/d) - Elektromechanik FFG Flensburger Fahrzeugbau Gesellschaft mbH
Flensburg Zum Job 
TÜV Technische Überwachung Hessen GmbH-Firmenlogo
Ausbildung Prüfingenieur/-in (m/w/d) bzw. Sachverständige/-r (m/w/d) für den Tätigkeitsbereich Fahrzeugprüfung und Fahrerlaubnisprüfung TÜV Technische Überwachung Hessen GmbH
Schlüchtern Zum Job 
Ostbayerische Technische Hochschule Amberg-Weiden (OTH)-Firmenlogo
Professur (m/w/d) der BesGr. W2 für das Lehrgebiet Solarenergie und Gebäudeautomation Ostbayerische Technische Hochschule Amberg-Weiden (OTH)
Wirtgen GmbH-Firmenlogo
Functional Safety Software Engineer (m/w/d) - für mobile Arbeitsmaschinen Wirtgen GmbH
Windhagen Zum Job 
WARO MSR-Technik GmbH-Firmenlogo
SPS-/DDC-Programmierer (m/w/d) und/oder DDC-Programmierer (m/w/d) WARO MSR-Technik GmbH
Lübeck Zum Job 
swa Netze GmbH-Firmenlogo
Elektroingenieur (m/w/d) Einspeiseanlagen mit Führungsperspektive swa Netze GmbH
Augsburg Zum Job 
WBS TRAINING-Firmenlogo
Lernbegleiter:in / Trainer:in für SPS-Programmierung (m/w/d) WBS TRAINING
Deutschland / Homeoffice Zum Job 
Prognost Systems GmbH-Firmenlogo
Spezialist für Maschinendiagnose im Technischen Support / Elektrotechniker / Maschinenbauer (m/w/d) Prognost Systems GmbH
Bundesamt für Bauwesen und Raumordnung (BBR)-Firmenlogo
Ingenieurinnen / Ingenieure (w/m/d) für Elektrotechnik Bundesamt für Bauwesen und Raumordnung (BBR)
HEINE Optotechnik GmbH & Co. KG-Firmenlogo
Ingenieur für Automatisierung und Robotik (m/w/d) HEINE Optotechnik GmbH & Co. KG
Gilching bei München Zum Job 

Gemini 3: Vom Chatfenster zur Denkmaschine

Gemini 3 soll sich weniger wie ein Dialogwerkzeug anfühlen. Google beschreibt die KI als „kognitiven Layer“, der Informationen verknüpft, Entscheidungen plant und Prozesse über längere Zeiträume im Blick behält. Die leitenden Personen hinter Gemini sprechen davon, einen weiteren Schritt in Richtung AGI zu gehen. Die Formulierungen wirken bewusst nüchtern – aber sie machen deutlich, wie weit die Ambitionen reichen.

Das Modell versteht verschiedene Eingaben gleichzeitig: Text, Bilder, Audio, Video und Code laufen in einem gemeinsamen Kontext zusammen. Das ermöglicht Anwendungen, die bei älteren Modellen kaum praktikabel waren. Sie können ein Git-Repository bereitstellen, ein paar lose Anforderungen formulieren, und Gemini 3 analysiert die gesamte Struktur. Die KI schlägt Funktionen vor, schreibt Tests, baut Interfaces und plant Anschlussaufgaben – und das alles in einem konsistenten Stil.

Das ist für viele Teams ein Paradigmenwechsel. Wo früher IDEs, manuelle Planung und kleinteilige Prompts nötig waren, positioniert Google jetzt ein System, das kontinuierlich denkt und handelt.

Reasoning als Kernfunktion

Google setzt bei Gemini 3 stark auf „Reasoning“. Gemeint ist die Fähigkeit, Zusammenhänge über mehrere Ebenen zu erkennen, logische Schlüsse zu ziehen und aus verstreuten Informationen eine stimmige Lösung zu entwickeln. Wo ältere Modelle häufiger Muster reproduzierten, soll Gemini 3 tatsächlich verstehen, wie einzelne Elemente zusammenhängen – etwa bei mathematischen, physikalischen oder softwaretechnischen Fragestellungen.

Die Performance in Prüfständen und anspruchsvollen Logiktests wird von Google hervorgehoben. Die Ergebnisse zeigen, dass das Modell lange Argumentationsketten verfolgen kann und weniger zu abrupten Richtungswechseln neigt. Das ist wichtig für Aufgaben, bei denen Zwischenschritte zählen – etwa bei technischen Berechnungen, Fehleranalysen oder Funktionsdesign in komplexen Systemen.

Die Entwickler hinter Gemini betonen, dass das Modell „ein neues Maß an Tiefe und Nuancen“ bietet. Die Antworten sollen direkter, präziser und informativer sein. Die KI verzichtet auf höfliche Umwege und kommt schneller zum Punkt.

Multimodales Verständnis mit Raumgefühl

Wie schon die Vorgänger verarbeitet auch Gemini 3 verschiedene Medientypen gleichzeitig. Neu ist der Anspruch, räumliche Informationen besser zu verstehen. Das bedeutet, die KI kann Szenen, Bewegungen und Anordnungen logischer einordnen. Das spielt eine Rolle, wenn Videos analysiert werden, eine Maschine im Bild untersucht wird oder Strukturen in wissenschaftlichen Visualisierungen erkannt werden sollen.

Google nennt Beispiele, die die Richtung zeigen:

  • handschriftliche Rezepte aus unterschiedlichen Sprachen werden entschlüsselt und in einem einheitlichen Format ausgegeben,
  • wissenschaftliche Videos, Papers und Tutorials werden zu kompaktem Lernmaterial verdichtet,
  • Sportaufnahmen werden so analysiert, dass Trainingspläne entstehen.

Der technische Hintergrund ist ein Kontextfenster mit bis zu 1 Mio. Tokens. Damit passen Inhalte, die früher in viele kleine Schritte zerlegt werden mussten, in einen einzigen Modellaufruf. Dokumentationen, Normen, Messreihen, Pläne oder Codebasen können als Gesamtstruktur verarbeitet werden.

Google-Suche: Der KI-Modus wird zur neuen Oberfläche

Ein entscheidender Teil der Gemini-3-Strategie findet in der Google-Suche statt. Der KI-Modus ersetzt die klassische Liste aus Links zunehmend durch ein dynamisches Layout. Sie stellen eine komplexe Frage – und erhalten eine Darstellung, die wie ein kleines Themen-Dossier wirkt. Texte, Grafiken, Karten und interaktive Elemente werden direkt aus der Anfrage generiert.

Wer ein technisches Thema recherchiert, bekommt damit eine strukturierte erste Annäherung. Das kann Projektstarts, Grundlagenvergleiche oder grobe Risikoabschätzungen beschleunigen. Die Google-Suche wird damit zum Interface einer KI, die Inhalte nicht nur sortiert, sondern aktiv aufbereitet.

Für zahlende Nutzer gibt es einen „Thinking“-Modus. Er ermöglicht längere Gedankengänge und schrittweise Argumentationen, die in klickbare Teilabschnitte zerfallen.

Gemini-App im Magazin-Look

Auch die Gemini-App selbst erhält ein neues Design. Statt langer Chat-Protokolle erscheinen Antworten in Form eines Magazin-Layouts. Themen wie Reisen, Technik, Geschichte oder Coding werden in Kacheln mit kurzen Abschnitten und visuellen Elementen strukturiert. Das erleichtert das Scrollen, verwischt aber zugleich die Grenze zwischen journalistischer Darstellung und KI-generiertem Inhalt.

Die App soll sich anfühlen wie eine Mischung aus Recherchewerkzeug, Notizbuch und persönlichem Wissensassistenten. Für viele Nutzende wird das vermutlich die neue Norm in der Alltagsnutzung von KI.

Antigravity: Googles neue Entwicklerplattform

Der markanteste Teil des Updates liegt tiefer in der Architektur. Google führt mit Gemini 3 eine neue Plattform ein: Antigravity. Dabei handelt es sich um eine Entwicklungsumgebung, in der KI-Agenten selbstständig arbeiten können.

Antigravity verbindet Editor, Terminal und Browser. KI-Agenten können Code bearbeiten, Befehle ausführen, Websites bedienen und Zwischenschritte dokumentieren. Gleichzeitig erzeugt die Plattform sogenannte Artefakte – etwa To-do-Listen, Testprotokolle, Screenshots oder Codeblöcke. Sie dienen dazu, den Prozess nachvollziehbar zu halten.

Antigravity läuft auf einem modifizierten Visual Studio Code und ist für Windows, macOS und Linux verfügbar. Die Umgebung ist darauf ausgelegt, dass mehrere Agenten parallel an Aufgaben arbeiten können. So entsteht ein System, das nicht nur Vorschläge macht, sondern tatsächlich Workflows ausführt.

Das zeigt, wohin die Entwicklung geht: automatisierte Entwicklungsschritte, weniger manuelle Routine und mehr Kontrolle durch Ziele statt durch einzelne Befehle.

Coding-Fähigkeiten: Vibe Coding und Agentik

Gemini 3 wird als besonders starkes Coding-Modell positioniert. Google hebt Vibe Coding hervor – also ein Programmierstil, bei dem Sie in natürlicher Sprache formulieren, was Sie erreichen wollen, und die KI übernimmt die Umsetzung.

In Benchmarks zu Webentwicklung, Terminal-Aufgaben und Fehlerbehebung erreicht das Modell hohe Werte. Es kann komplexe Aufgabenpakete ausführen, etwa:

  • neue Projekte anlegen,
  • Datenpipelines schreiben,
  • Build-Prozesse konfigurieren,
  • Fehler analysieren und beheben,
  • Tests generieren.

Damit verschiebt sich die Rolle der KI. Sie ist nicht mehr Werkzeug zur Vervollständigung einzelner Zeilen, sondern ein System, das von selbst auf eine konsistente Architektur hinarbeitet. Das kann Entwicklungszyklen verändern – schneller, aber auch stärker abhängig von KI-Entscheidungen.

Langfristige Planung: Konsistenz über viele Schritte

Ein Schwachpunkt früherer Agenten war die Fähigkeit zur langfristigen Planung. Viele Modelle verloren nach einigen Schritten die Kohärenz. Gemini 3 soll hier stabiler arbeiten. Google verweist auf Langzeit-Simulationen, in denen das Modell Entscheidungen über ein virtuelles Jahr hinweg trifft – etwa in Bezug auf Preise, Bestellungen, Lagerbestände oder Anpassungen von Strategien.

Die KI soll über viele Iterationen hinweg konsequenter arbeiten, ohne sich „zu verrennen“. Das eröffnet Szenarien wie:

  • Wartungsplanung über Monate,
  • kontinuierliche Überwachung von Systemen,
  • Projektplanung über längere Phasen,
  • automatisierte operative Entscheidungen.

Wenn Agenten in solchen Bereichen zuverlässig bleiben, ist das ein wichtiger Schritt für den produktiven Einsatz.

Sicherheit: Robust gegen Manipulation

Google betont, dass Gemini 3 strenger mit riskanten Anfragen umgeht. Die KI soll weniger dazu neigen, auf heikle Prompts einzusteigen, und resistenter gegen gezielte Manipulationsversuche sein. Dazu gehört der Schutz vor sogenannten Prompt-Injections – Angriffen, bei denen versteckte Befehle in harmlose Texte eingebettet werden.

Außerdem verweist Google auf externe Sicherheitsbewertungen und Stresstests. Der besonders mächtige Deep-Think-Modus wird zunächst nur für eine begrenzte Anzahl von Personen freigegeben, bevor er breiter verfügbar wird.

 

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.