Adobe continue d’étendre les capacités de son IA générative Firefly — cette fois, au service des cinéastes et vidéastes. Deux nouveaux outils, Generate Soundtrack et Generate Speech, arrivent dans la version repensée de l’application Firefly, tandis qu’un nouvel éditeur vidéo Web combinant plusieurs fonctions d’IA est également en préparation.
Generate Soundtrack : des bandes-son créées sur mesure par IA
L’outil Generate Soundtrack, désormais disponible en bêta publique dans Firefly, analyse une vidéo importée puis génère automatiquement des morceaux instrumentaux synchronisés avec les images.
L’utilisateur peut définir le style musical en choisissant parmi des préréglages (lofi, hip-hop, classique, EDM, etc.) ou simplement décrire l’ambiance souhaitée dans une invite textuelle — par exemple « plus mélancolique » ou « plus énergique ». Firefly suggère même une proposition de prompt basée sur le contenu du clip, pour faciliter la création.
« Nous voulons aider les utilisateurs à apprendre à formuler leurs demandes musicales. Si vous importez un clip, notre IA prédira quel type de musique lui correspond », explique Alexandru Costin, responsable de l’IA générative chez Adobe. « Mais nous proposons aussi une approche façon Mad Libs, où vous choisissez le ton, le style et l’objectif de votre vidéo ».

Chaque requête produit quatre variantes distinctes, jusqu’à cinq minutes chacune. Le modèle Firefly sous-jacent a été entraîné sur du contenu sous licence, garantissant des pistes sans risque de violation de droits d’auteur. « Nous avons acheté la musique et les voix auprès des ayants droit, ce qui nous permet de garantir une utilisation commerciale sûre », précise Costin.
Cette stratégie donne à Adobe un avantage sur des concurrents comme Suno ou Udio, actuellement visés par des plaintes pour utilisation de contenus protégés.
Generate Speech : une narration IA multilingue
Également en bêta publique, Generate Speech permet de créer des voix-off à partir de texte. L’outil propose plus de 50 voix, générées soit par le Firefly Speech Model, soit par ElevenLabs, et prend en charge plus de 20 langues.
Les créateurs peuvent ajuster la vitesse, la hauteur, l’émotion, et même corriger manuellement la prononciation de mots complexes ou de noms propres.
Firefly Video Editor : un nouvel outil de montage web en préparation
Enfin, Adobe prépare un tout nouvel outil : le Firefly Video Editor, décrit comme un éditeur à piste multipiste pour générer, organiser, découper et séquencer des clips. Ce logiciel Web regroupera toutes les fonctions Firefly liées à la génération de voix-off, de musiques et de titres, tout en intégrant des outils d’édition image par image et des presets de style visuel.
Le Firefly Video Editor sera lancé en bêta privée dès le mois prochain, et les utilisateurs intéressés peuvent dès à présent s’inscrire sur liste d’attente pour un accès anticipé.
L’objectif est clair : simplifier la création audiovisuelle grâce à l’IA, sans sacrifier la qualité ni la conformité juridique.


