L’entreprise à l’origine de TikTok, ByteDance, a lancé un nouvel outil d’intelligence artificielle appelé MagicVideo-V2 qui repousse les limites de la génération de vidéos à partir de texte.

MagicVideo-V2 s’appuie sur une intelligence artificielle de pointe pour produire un contenu vidéo de haute qualité à partir de textes. Lors d’évaluations humaines comparant les vidéos créées par MagicVideo-V2 et d’autres générateurs de texte-vidéo tels que Pika 1.0 et Stable Diffusion-XT, le nouvel outil de ByteDance s’est avéré nettement plus performant que ses concurrents.

Selon la page GitHub du projet, il combine un « modèle texte-image, un générateur de mouvement vidéo, un module d’intégration d’images de référence et un module d’interpolation d’images dans un pipeline de génération vidéo de bout en bout ».

ByteDance just announced MagicVideo-V2

Multi-Stage High-Aesthetic Video Generation

paper page: https://t.co/OczWLXhIrx

paper page: https://t.co/OczWLXhIrx

— AK (@_akhaliq) January 10, 2024