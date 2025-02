Accueil » Gemini Live : l’IA de Google devient plus interactive et connectée !

Google continue d’améliorer son assistant IA Gemini Live en lui ajoutant de nouvelles fonctionnalités, telles que le partage d’écran et la diffusion vidéo en direct, tout en renforçant ses capacités de compréhension linguistique.

Dans un e-mail adressé aux utilisateurs, Google a annoncé que Gemini Live bénéficie désormais de son dernier modèle d’intelligence artificielle, ce qui améliore sa capacité à comprendre différentes langues, accents et dialectes. Cette mise à jour inclut également des améliorations en traduction et introduit le partage d’écran et le streaming vidéo en direct, rendant l’interaction avec l’IA plus dynamique et engageante.

Toutefois, comme pour toute amélioration des assistants IA, ces avancées impliquent une collecte accrue de données personnelles. Google souhaite stocker les données audio, vidéo et de partage d’écran des utilisateurs dans leur historique d’activité Gemini Apps, bien que cette option puisse être désactivée. Actuellement, seules les transcriptions de conversations sont enregistrées si l’utilisateur a activé cette fonctionnalité.

Ces nouveautés s’appuient vraisemblablement sur l’API Multimodal Live, introduite avec Gemini 2.0 à la fin de l’année dernière. Cette API permet aux développeurs de traiter divers types d’entrées — texte, audio, vidéo — et de générer des réponses adaptées sous forme de texte ou de son.

L’évolution de Gemini Live s’inscrit dans une tendance plus large vers des IA multimodales, capables de traiter différents types de données de manière fluide, rendant leur utilisation plus intuitive et polyvalente. Google considère Gemini 2.0 comme le début de « l’ère des agents », où l’IA ne se contente plus de répondre aux requêtes, mais anticipe les besoins et agit de manière proactive.

Gemini Live profite de Gemini 2.0

L’un des premiers modèles à exploiter cette évolution est Gemini 2.0 Flash, qui est 2x plus rapide que son prédécesseur, Gemini Pro 1.5. Ce modèle marque un tournant dans le développement des IA, en passant de simples chatbots conversationnels à des agents capables de raisonner et d’agir de manière autonome.

Cette transformation pourrait révolutionner des secteurs tels que le service client, l’éducation, la santé et la productivité personnelle. Cependant, elle pose aussi la question de la confidentialité, car ces systèmes nécessitent un accès accru aux données des utilisateurs pour fonctionner de manière optimale.

Les mises à jour de Gemini Live sont en cours de déploiement et offrent une expérience IA plus interactive et intelligente, pour ceux qui choisiront d’activer ces nouvelles fonctionnalités.