KI im Alltag 28.10.2024, 12:00 Uhr

Mit „Project Jarvis“ wird Chrome-Browser zum persönlichen Assistenten

Google entwickelt ein KI-System mit dem Namen „Project Jarvis“, das eigenständig im Chrome-Browser navigieren und Aufgaben erledigen kann. Die Präsentation ist für Dezember angesetzt.

Google

„Project Jarvis“ von Google: Der KI-Assistent, der das Browsing unterstützt.

Foto: PantherMedia / elfachero3@gmail.com

Stellen wir uns vor, man möchte ein Buch kaufen: Man öffnet den Browser, gibt den Titel oder Autor ein, durchsucht die Suchergebnisse, klickt auf verschiedene Online-Shops, vergleicht Preise und Versandoptionen, und fügt das Buch schließlich dem Warenkorb hinzu. Klingt fast schon wie Routine, ist aber trotzdem zeitaufwändig. Oder das Buchen eines Fluges kann mühsam sein: Man muss ebenso den Browser öffnen, Suchbegriffe eingeben, ebenso durch die Ergebnisse scrollen, auswählen, vergleichen und schließlich buchen. Google möchte diesen Prozess vereinfachen und einige Aufgaben automatisieren.

Mit „Project Jarvis“ könnte Google den Chrome-Browser so erweitern, dass er eigenständig Aufgaben für die Nutzer erledigt. Das würde bedeuten, dass der Browser automatisch Aktionen ausführen kann, ohne dass der Nutzer jeden Schritt selbst machen muss. Jarvis kann blitzschnell Informationen zu verschiedenen Themen recherchieren, Flüge, Hotels und andere Dienstleistungen direkt buchen und auch das Finden und Kaufen von Produkten im Handumdrehen übernehmen.

Project Jarvis basiert auf Gemini 2

Project Jarvis basiert auf Googles neuem Sprachmodell Gemini 2, das ebenfalls im Dezember erscheinen soll, und wurde speziell für den Chrome-Browser entwickelt. Zunächst wird es nur einer kleinen Nutzergruppe zum Testen bereitgestellt, wobei der genaue Starttermin noch unsicher ist, wie The Information berichtet.

Das Ziel von Project Jarvis ist, wie bereits erwähnt – Routineaufgaben im Browser zu übernehmen – bevor der Nutzer selbst eingreift, etwa durch das Ausfüllen von Textfeldern oder das Klicken auf Buttons.

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
VIAVI Solutions GmbH-Firmenlogo
Graduate Rotational Program - Entwicklungsingenieur (FPGA / KI) (w/m/d) VIAVI Solutions GmbH
Eningen unter Achalm Zum Job 
OCS Optical Control Systems GmbH-Firmenlogo
Entwicklungsingenieure (m/w/d) für die Bildverarbeitung & Softwareentwicklung OCS Optical Control Systems GmbH
DNV-Firmenlogo
(Senior) Consultant for Digital System Operation (f/m/d) DNV
Dresden, Schönefeld Zum Job 
Sanofi-Aventis Deutschland GmbH-Firmenlogo
Trainee Manufacturing & Supply (all genders) Sanofi-Aventis Deutschland GmbH
Frankfurt Zum Job 
IMS Röntgensysteme GmbH-Firmenlogo
Entwicklungsingenieur (m/w/i) für digitale Inspektionssysteme IMS Röntgensysteme GmbH
Heiligenhaus Zum Job 
Amt für Binnen-Verkehrstechnik-Firmenlogo
Ingenieurin / Ingenieur (m/w/d) (FH-Diplom/Bachelor) in der Fachrichtung Informatik mit der Vertiefungsrichtung Nachrichtentechnik/Informationstechnik oder vergleichbar Amt für Binnen-Verkehrstechnik
Koblenz Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
BIM-Manager (w/m/d) Die Autobahn GmbH des Bundes
Hohen Neuendorf-Stolpe Zum Job 
FRITZ!-Firmenlogo
Entwicklungsingenieur für Produktionstestsysteme (w/m/d) FRITZ!
THD - Technische Hochschule Deggendorf-Firmenlogo
Professorin | Professor (m/w/d) für das Lehrgebiet Robotik THD - Technische Hochschule Deggendorf
DB InfraGO AG-Firmenlogo
Teilprojektleiter:in Ausrüstungstechnik (w/m/d) DB InfraGO AG
Hamburg Zum Job 
Hochschule Osnabrück-Firmenlogo
Professur für Hard- und Software Digitaler Systeme Hochschule Osnabrück
Osnabrück Zum Job 

Das Modell benötigt „Bedenkzeit“

Insider berichten von derzeitigen Einschränkungen: Der Agent arbeitet noch recht langsam, da das Modell vor jeder Aktion einige Sekunden „Bedenkzeit“ benötigt. Außerdem steht Google vor der Herausforderung, Nutzer dazu zu bringen, dem System sensible Daten wie Passwörter und Kreditkarteninformationen anzuvertrauen.

Erst vor kurzem kam die Nachricht, dass Google seinen KI-Assistenten Gemini Live nun auch auf Deutsch herausbringt. Die Software, die Gespräche mit Nutzern führen kann, soll auf Android-Smartphones in über 40 Sprachen verfügbar sein. Ursprünglich war sie im August auf Englisch gestartet. In den kommenden Wochen soll Gemini sich mit weiteren Google-Diensten wie Kalender und Erinnerungen verknüpfen lassen.

Diese Verknüpfungen sollen den Chatbot in alltäglichen Situationen hilfreicher machen. Die Vision ist, dass Gemini Aufgaben auf Sprachbefehl übernimmt: So könnte die KI beispielsweise ein per Gmail empfangenes Kochrezept finden und die Zutaten direkt auf eine Einkaufsliste setzen. Ebenso könnte man ein Konzertposter fotografieren, woraufhin Gemini überprüft, ob an diesem Tag laut Kalender noch Zeit verfügbar ist, und eine Erinnerung für den Ticketkauf anlegen lassen.

Ein Beitrag von:

  • Alexandra Ilina

    Alexandra Ilina ist Diplom-Journalistin (TU-Dortmund) und Diplom-Übersetzerin (SHU Smolensk) mit mehr als 20 Jahren Berufserfahrung im Journalismus, in der Kommunikation und im digitalen Content-Management. Sie schreibt über Karriere und Technik.

Themen im Artikel

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.