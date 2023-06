Meta nous donne un aperçu de l’avenir avec MusicGen, un nouveau modèle d’IA open source capable de produire de courtes chansons en fonction de vos données. Bien qu’il soit loin d’être un produit fini, MusicGen est impressionnant, et vous pouvez conditionner l’IA avec une mélodie existante pour améliorer ses résultats.

Développé par l’équipe interne Audiocraft de l’entreprise, MusicGen est comme une version musicale de ChatGPT. Vous entrez un bref texte décrivant le type de musique que vous souhaitez écouter, vous cliquez sur Generate et, en peu de temps, l’IA crée un morceau de 12 secondes selon vos instructions.

Pour tester l’IA MusicGen, il suffit de se rendre sur le site Web Hugging Face, d’attendre que le modèle se charge et de commencer à frapper. MusicGen s’appuie sur la saisie de texte, vous devez donc décrire exactement ce que vous voulez entendre.

L’IA produit un morceau d’une durée de 12 secondes seulement et, bien entendu, les résultats sont extrêmement irréguliers. Les messages simples semblent donner les meilleurs résultats. Et si vous voulez être très précis avec l’IA, vous pouvez lui donner un fichier musical d’une chanson existante. L’IA se « conditionnera » alors à la mélodie de la chanson, mais n’enregistrera pas les chansons téléchargées dans sa base de données.

À l’instar de l’IA MusicLM de Google, le résultat de MusicGen peut sembler un peu flou, brumeux ou étouffé. Les instruments ne sont pas très définis, surtout lorsque l’IA est ambitieuse. D’après mes tests, l’IA fait rarement du bon travail avec tous les « instruments » qu’elle joue, bien qu’elle ait généralement un ou deux instruments bien définis et nets.

Un entraînement sur 20 000 heures de musique

Meta indique que MusicGen a été entraîné sur 20 000 heures de musique sous licence, y compris des morceaux provenant des bibliothèques Shutterstock et Pond5. Il est important de garder cela à l’esprit, car la musique sous licence a tendance à avoir une certaine ambiance et penche généralement vers les genres électronique, hip-hop, classique et country. Je suis certain que l’ensemble des données de l’IA contient une variété de morceaux très différents, mais il se peut qu’elle gère mieux certains genres que d’autres.

Vous pouvez également visiter le site GitHub pour une approche plus pratique de ce modèle d’IA.