Google a annoncé Gemini Live pour la première fois lors de son événement de lancement du Pixel 9 le mois dernier, mais il n’était jusqu’à présent disponible que pour les abonnés à Gemini Advanced.

Un mois seulement après son lancement en tant que fonctionnalité réservée aux abonnés, Gemini Live de Google s’ouvre à un plus grand nombre d’utilisateurs, gratuitement. Cette annonce marque une étape importante dans la démocratisation de l’interaction vocale avec les chatbots d’intelligence artificielle.

Gemini Live se positionne comme la réponse de Google au mode vocal avancé de ChatGPT développé par OpenAI. Il permet aux utilisateurs d’interagir directement et de manière conversationnelle avec le chatbot, en temps réel, en utilisant des invites vocales en langage naturel plutôt que des entrées textuelles.

Comment accéder à Gemini Live ?

Pour accéder à cette fonctionnalité, il suffit d’ouvrir l’application Gemini et de cliquer sur la nouvelle icône de forme d’onde dans le coin inférieur droit de l’application. Le microphone est alors activé, ce qui vous permet de poser une question à Gemini Live.

Une fois la conversation terminée, vous pouvez cliquer sur le bouton « Stop » ou simplement dire « stop » pour que le système génère une transcription de votre échange. Cette transcription sera ensuite disponible dans votre historique de chat pour une consultation ultérieure.

Bien que prometteuse, cette fonctionnalité présente encore quelques limitations. Elle est actuellement réservée aux utilisateurs Android anglophones et ne peut pas être utilisée sur les appareils iOS ni avec les autres intégrations Workspace de Gemini, telles que YouTube Music ou Gmail. Cette compatibilité étendue est cependant prévue pour l’avenir.

Comparaison avec le mode vocal avancé de ChatGPT

Le mode vocal avancé d’OpenAI est encore en version bêta et n’est accessible qu’à certains abonnés ChatGPT Plus. OpenAI a annoncé un déploiement plus large dans les mois à venir, mais aucune date précise n’a été fixée. De plus, les utilisateurs de ChatGPT devront débourser 20 dollars par mois pour avoir une chance d’accéder à cette fonctionnalité, sans garantie d’accès immédiat.

Google et OpenAI travaillent tous deux à l’intégration de la caméra des appareils mobiles dans leurs fonctionnalités de chat vocal en direct. Cela permettrait à votre téléphone d’accéder à un contexte multimodal supplémentaire pour répondre à vos requêtes vocales, mais aucune date de sortie spécifique n’a été annoncée pour le moment.