Google vient de répondre à l’une des demandes les plus pressantes de ses utilisateurs : l’application Gemini accepte désormais le téléchargement et l’analyse de fichiers audio. MP3, M4A, WAV… quel que soit le format, l’IA peut transcrire, résumer et extraire les points clés d’un enregistrement.
Disponible sur Android, iOS et le Web, cette nouvelle option transforme un simple fichier sonore — réunion, interview, cours ou mémo vocal — en document structuré et exploitable.
✅ Papercut fixed: You can now upload any file to @GeminiApp. Including the #1 request: audio files are now supported! pic.twitter.com/4Te3xwLC6W
— Josh Woodward (@joshwoodward) September 8, 2025
Comment ça marche ?
Il suffit d’ouvrir l’appli Gemini, d’aller dans le menu + (sur mobile) ou dans « Uploader des fichiers » (sur le Web), puis de sélectionner un fichier audio. L’IA s’occupe du reste : transcription mot pour mot, détection de locuteurs, résumés synthétiques ou encore extraction de tâches et citations importantes.
Mieux encore, on peut analyser jusqu’à 10 fichiers en même temps, qu’il s’agisse de simples enregistrements ou même d’archives ZIP (limitées à 10 éléments).
Des limites selon votre abonnement
Google a prévu une hiérarchie claire d’usages :
- Version gratuite : transcription limitée à 10 minutes par fichier, avec 5 prompts/jour. Un plafond généreux comparé aux services concurrents gratuits.
- Google AI Pro/Ultra : jusqu’à 3 heures d’audio par fichier, idéal pour podcasteurs, journalistes ou étudiants qui veulent analyser conférences et interviews sans découper les enregistrements.
À 21,99 euros/mois, le plan AI Pro se positionne comme un outil accessible aux professionnels qui cherchent une alternative abordable aux logiciels de transcription classiques.
Un trio de mises à jour Gemini
Cette nouveauté s’accompagne de deux autres annonces :
- Google Search en AI Mode prend désormais en charge 5 nouvelles langues : hindi, indonésien, japonais, coréen et portugais brésilien.
- NotebookLM enrichit son éventail de rapports (fiches de révision, blogs, briefings, quiz, flashcards), disponibles en plus de 80 langues.
Ces ajouts confirment la stratégie de Google : accélérer l’intégration de Gemini dans tout son écosystème, du moteur de recherche aux outils de productivité.
Gemini avec l’audio, c’est bien plus qu’une simple transcription. On passe du brut au contenu actionnable et intelligent, directement exploitable pour gagner du temps au quotidien. La limite de 10 minutes pour les comptes gratuits reste contraignante, mais largement suffisante pour tester. Les formules payantes, elles, ouvrent la voie à une adoption professionnelle massive.



