Google continue d’affiner son modèle de génération vidéo avec le lancement de Veo 3.1, une nouvelle version qui améliore considérablement la qualité audio, les options d’édition et la fidélité des rendus à partir d’images.
Cette mise à jour succède à Veo 3, dévoilé en mai dernier, et renforce encore la position de Google dans la course à la vidéo générée par IA.
Veo 3.1 : Un son plus immersif et des vidéos plus naturelles
Avec Veo 3.1, Google introduit la génération audio intégrée à ses clips IA. Chaque vidéo produite peut désormais inclure une bande-son ou des effets sonores contextuels, rendant le résultat plus vivant et immersif.
Le modèle améliore également la cohérence visuelle et le réalisme des mouvements, tout en respectant mieux les indications fournies par l’utilisateur — un défi majeur pour les modèles de vidéo générative.
Des outils d’édition plus précis
Google met l’accent sur le contrôle granulaire de la création. Les utilisateurs peuvent désormais :
- ajouter un objet dans une scène existante et l’intégrer harmonieusement au style du clip ;
- bientôt supprimer des objets directement dans Flow, l’éditeur vidéo propulsé par Veo ;
- étendre une vidéo à partir de ses dernières images pour prolonger la séquence de manière fluide ;
- ou encore utiliser une image de référence pour animer un personnage ou générer une scène à partir d’un cadre initial et final.
Toutes ces fonctionnalités prennent désormais en charge l’audio, renforçant la cohérence globale entre le son et l’image.
Déploiement dans Flow, Gemini et Vertex
Le modèle Veo 3.1 est déployé dès aujourd’hui dans plusieurs produits de l’écosystème Google :
- Flow, son éditeur vidéo intelligent,
- l’application Gemini,
- ainsi que les APIs Gemini et Vertex pour les développeurs.
Depuis le lancement de Flow en mai dernier, Google affirme que plus de 275 millions de vidéos ont déjà été créées sur la plateforme.
Vers une nouvelle ère de création vidéo par IA
Avec Veo 3.1, Google confirme sa volonté de faire de la génération vidéo multimodale un pilier central de sa stratégie IA. En combinant image, son et édition fine, le modèle se positionne comme l’un des plus complets du marché, face à des concurrents comme Runway Gen-3 Alpha ou Pika 2.



