Eine neue Generation des KI-Systems Gemini von Google US02079K1079 soll künftig in der Lage sein, eigenständig als Assistent bestimmte Aufgaben zu erledigen.
11.12.2024 - 16:37:57Neue Google-KI kann selbstständig Aufgaben erledigen
Das kündigte Google zum Jahrestag der ersten Gemini-Premiere in Mountain View an. Denkbar sei, dass der "KI-Agent" etwa die Bauteile für ein Hobbyprojekt in Online-Stores ausfindig mache und eigenständig in den Warenkorb lege. Der eigentliche Bestellvorgang würde aber weiterhin von der Anwenderin oder dem Anwender vorgenommen.
"KI soll nützlicher werden"
Google-CEO Sundar Pichai sagte, bei der ersten Generation Gemini 1.0 sei es darum gegangen, Informationen zu organisieren und zu verstehen. "Bei Gemini 2.0 geht es darum, viel nützlicher zu sein."
Die neuartigen KI-Assistenten sind Teil von "Project Mariner", das mit der neuen KI-Generation umgesetzt wurde. Gemini 2.0 sei für das Zeitalter der Agenten entwickelt worden, sagte Google-Managerin Tulsee Doshi. Das System sei in der Lage, intelligente Tools zu nutzen und könne direkt auf Google-Produkte wie die Suche zugreifen. Es könne sogar Programm-Code ausführen. "Diese Fähigkeiten ergeben Agenten, die denken, sich erinnern, planen und sogar Maßnahmen in Namen der Anwenderinnen und Anwender ergreifen können."
Klicken wie ein Mensch
"Mariner" verhalte sich also genauso, wie es menschliche Nutzer in einem Browser tun würden, betonte Doshi. "Er kann klicken, tippen und scrollen, genau wie Sie als Anwenderin oder Anwender". Dabei identifiziere das System allerdings auch eine Reihe von Aufgaben, die der Agent nicht im Namen eines Nutzers übernehmen sollte. "Ein gutes Beispiel hierfür ist, dass Mariner einen Kauf nicht abschließt, ohne den Nutzer zuvor zu fragen, ob er dies auch wirklich möchte." "Mariner" werde erst mit vertrauenswürdigen Testpersonen ausprobiert, bevor es einer größeren Öffentlichkeit zur Verfügung gestellt werde.
Neue KI-Brille
Im "Project Astra" treibt Google nun auf Basis von Gemini 2.0 ein Forschungsvorhaben zur Erkundung der Umgebung voran, das erstmals im vergangenen Frühjahr auf der Entwicklerkonferenz Google I/O vorgestellt wurde. Künftig sollen die User nicht nur auf einem Smartphone nützliche Informationen eingeblendet bekommen, sondern auch auf einer smarten Brille. Sie ähnelt der Ray-Ban-Brille vom Facebook-Konzern Meta US30303M1027, die etwa Bauwerke oder Kunstwerke erkennen oder beim Kochen helfen kann.
Für Softwareentwickler, die auf Basis der Google-KI eigene Lösungen anbieten, ist vor allem die Systemvariante Gemini Flash relevant. Sie kann nicht nur auf großen Computern im Rechenzentrum laufen, sondern auch lokal auf Personal Computern oder bestimmten Smartphone-Modellen. Google präsentierte am Mittwoch Gemini Flash 2.0, das nach Angaben des Unternehmens eine verbesserte Leistung bei ähnlich schnellen Reaktionszeiten bietet.