La promesse du projet Astra se concrétise enfin. Google commence le déploiement des fonctions de vision pour son assistant Gemini, transformant radicalement l'interaction entre utilisateurs et intelligence artificielle. Ces nouveautés, réservées aux abonnés Premium, marquent une évolution majeure des services d'IA proposées par Google.
Gemini développe la vue : comment ça marche ?
Deux fonctionnalités phares sont en cours de déploiement :
- Partage d'écran : Gemini analyse et interprète tout ce qui s'affiche sur votre smartphone
- Vision par caméra : L'IA comprend en temps réel ce que filme votre appareil photo
En clair, Gemini voit désormais comme l'utilisateur et peut être interpellé à ce sujet. Il peut non seulement identifier ou se prononcer sur des applications qui sont ouvertes, les notifications et tout le contenu affiché à l'écran.
Un accès encore limité
Pour bénéficier de ces innovations, il faut :
- Posséder un abonnement Google One AI Premium (21,99€/mois)
- Utiliser un smartphone compatible (Pixel et Galaxy S25 en priorité)
- Paramétrer la langue du système en anglais (pour le moment)
Google a offert un an d'abonnement aux acheteurs de Pixel 9 et propose -50% aux étudiants. Le déploiement complet devrait s'étendre sur plusieurs semaines.
Des applications pratiques au quotidien
Ces nouvelles capacités ouvrent des perspectives impressionnantes :
Aide à la lecture : Gemini peut résumer un article affiché à l'écran ou expliquer des termes techniques. Assistance visuelle : L'IA guide pour monter un meuble ou choisir une recette en analysant les ingrédients disponibles, donner des idées déco, identifier un objet, un bâtiment, une oeuvre d'art... Accessibilité : Description audio de l'environnement pour les malvoyants, localisation de certains éléments dans le décor, guidage audio en temps réel en intérieur sans GPS.
Quid de la vie privée ?
Google rassure : le traitement des images se fait majoritairement en local sur l'appareil. "Les données visuelles ne sont pas stockées sans consentement explicite", précise un porte-parole. Une option permet de désactiver complètement ces fonctions pour les plus prudents.
Cette avancée place Google en tête de la course à l'IA visuelle, devançant même ChatGPT qui propose une fonction similaire mais dans une version moins aboutie. Reste à voir comment évoluera cette technologie lorsque le déploiement sera complet et ce qu'il en sera de l'expérience en fonction de chaque smartphone.