Au nom de code Jarvis, un agent IA de Google serait en préparation et pourrait être officiellement présenté dès le mois de décembre prochain, en marge de Gemini 2.0. Son existence ne fait désormais plus vraiment de doute, à la faveur d'une fuite.

The Information rapporte que Google a " accidentellement publié une préversion interne " de cet agent IA dans le Chrome Web Store. Sous la forme d'une extension pour le navigateur Chrome, il y a été introduit comme " un compagnon utile qui surfe sur le Web avec vous. "

Rapidement retiré du Chrome Web Store, le prototype n'était pas utilisable, en raison d'autorisations d'accès nécessaires et indisponibles pour l'exécution de fonctions. Il faudra donc encore patienter un peu avant d'en savoir davantage.

L'automatisation de tâches du quotidien

D'après The Information, Jarvis (ou un autre nom qui lui sera donné) prend le contrôle du navigateur web d'une personne afin d'effectuer pour elle des tâches comme la recherche, l'achat ou la réservation d'un vol.

Ce type d'automatisation de tâches du quotidien sur internet s'appuierait sur la prise fréquente de captures de l'affichage à l'écran et une interprétation par un modèle d'IA. L'agent IA réaliserait des actions comme des clics sur des boutons et des saisies de texte dans des champs.

Rappelons qu'Anthropic a récemment dévoilé le développement d'un modèle d'utilisation de l'ordinateur pour Claude 3.5 Sonnet.

Le patron de Google mise sur les agents IA

Patron de Google, Sundar Pichai avait déclaré vouloir aller plus loin avec les agents IA : " Je les considère comme des systèmes intelligents, capables de raisonner, de planifier, de mémoriser, d'anticiper plusieurs étapes à l'avance et de travailler avec des logiciels et des systèmes, tout cela pour accomplir quelque chose en votre nom et, surtout, sous votre supervision. "

google-sundar-pichai-agent-ia-gemini-chrome-automatisation

Lors de l'édition 2024 de la conférence Google I/O, Sundar Picahi avait notamment pris pour exemple un travail en collaboration entre l'IA Gemini et le navigateur Chrome, afin d'automatiser des tâches à la suite d'un déménagement (chercher des services à proximité, mettre à jour une adresse sur des sites...).