Au cas où vous ne le sauriez pas encore, nous nous dirigeons vers une réalité glorieuse, digne de Skynet, où l’IA se rapproche dangereusement de la sensibilité. Nous n’en sommes pas encore là, mais les choses changent rapidement.

Si les outils et les technologies alimentés par l’IA existent depuis des années, leurs progrès atteignent des niveaux tels qu’ils commencent à menacer la dépendance humaine de nombreux secteurs clés, de la restauration rapide à l’ingénierie logicielle. Nous avons tous entendu parler des merveilles universelles de ChatGPT ces derniers temps, et il n’a même pas encore atteint sa forme maximale.

Aujourd’hui, Google nous montre à quel point l’IA peut être intelligente lorsqu’il s’agit de créer de la musique. En effet, Google présente MusicLM, un nouvel outil d’IA qui génère de la musique de haute qualité à partir de descriptions textuelles. Il peut comprendre des phrases telles que « une mélodie de violon apaisante soutenue par un riff de guitare distordu » et les convertir en compositions musicales correspondantes.

Il s’agit d’une avancée majeure dans le domaine de la musique générée par l’IA, qui pourrait avoir un impact considérable sur la façon dont la musique est créée et consommée. Encore une fois, c’est quelque chose que d’autres ont déjà essayé, mais MusicLM semble représenter un saut quantique dans les capacités de ce genre de systèmes.

L’outil est convivial et facile à utiliser, ce qui le rend accessible à un large éventail d’utilisateurs. Il utilise une approche de modélisation hiérarchique de séquence à séquence pour générer de la musique à 24 kHz, qui reste cohérente pendant plusieurs minutes.

Plusieurs fonctionnalités clés

Les expériences montrent que MusicLM surpasse les systèmes précédents en termes de qualité audio et de respect de la description textuelle. Il peut également prendre en entrée à la fois du texte et une mélodie existants, ce qui lui permet de transformer des mélodies sifflées et fredonnées selon le style décrit dans une légende textuelle. Pour soutenir les recherches futures, les développeurs ont rendu public MusicCaps, un ensemble de données de 5,5 milliers de paires musique-texte, avec des descriptions textuelles riches fournies par des experts humains.

Il présente plusieurs fonctionnalités clés, notamment :

Génération d’audio à partir de légendes riches : MusicLM peut générer des compositions complexes et nuancées à partir de simples descriptions textuelles
Génération longue : MusicLM peut générer de la musique qui reste cohérente pendant plusieurs minutes
Mode histoire : Il permet aux utilisateurs de générer de la musique qui raconte une histoire, il peut être utilisé pour la notation musicale de films, de séries et d’autres médias
Conditionnement du texte et de la mélodie : MusicLM peut prendre en entrée à la fois du texte et une mélodie existants, ce qui lui permet de transformer des mélodies sifflées et fredonnées selon le style décrit dans une légende de texte
Conditionnement de la légende d’un tableau : Il génère de la musique en fonction de l’émotion et du style décrits dans la légende d’une peinture

En outre, MusicLM peut détecter différents niveaux d’expérience des musiciens, des lieux, des époques, des solos d’accordéon et la diversité des générations tout en gardant le conditionnement et/ou les jetons sémantiques constants, la même invite textuelle et les mêmes jetons sémantiques, et bien plus encore.

Un livre blanc détaillant les recherches menées sur le projet indique que MusicLM a été construit sur AudioLM, qui peut entendre un morceau de musique et tenter de l’émuler. Toutefois, les membres du projet suggèrent que la mise en œuvre d’une solution axée sur le texte est une entreprise beaucoup plus intense, car il est beaucoup plus difficile d’entraîner avec précision le modèle aux complexités des sons par le biais de définitions humaines quotidiennes.

Quel est l’avenir de l’IA ?

Bien que nous ne puissions pas jouer avec MusicLM nous-mêmes (il n’a pas été rendu public), il reste encore du travail à faire à partir de la vaste bibliothèque d’échantillons prélevés. Si les caractéristiques des chansons semblent correspondre exactement aux descriptions fournies au système, les morceaux qui en résultent ne sont pas toujours cohérents. Cela dit, même dans son état actuel, le système pourrait être un excellent outil pour créer, par exemple, des morceaux libres de droits pour les chaînes YouTube, ou du moins donner aux utilisateurs un point de départ solide pour s’inspirer.

Mais ce n’est qu’un vœu pieux : Google n’a pas exprimé l’intention de l’ouvrir à l’usage public.

Les experts sont convaincus que l’intelligence artificielle explosera en termes de fidélité et d’utilité en 2023. L’engouement du public a déjà atteint un pic, avec des outils tels que ChatGPT et Jasper.ai qui commencent à susciter l’engouement du grand public. Il est impossible de prédire le délai dans lequel l’intelligence artificielle atteindra le niveau de maturité nécessaire pour envahir la quasi-totalité de la société humaine, mais il est clair aujourd’hui que sa progression ne ralentit pas.

Chrome tourne définitivement la page de Manifest V2 : la fin de uBlock Origin approche

Threads dépasse les 500 millions d’utilisateurs : Meta accélère sa bataille contre X

Xbox pourrait bientôt proposer le paiement en plusieurs fois avec Klarna et PayPal

EA Advertising : Electronic Arts transforme ses jeux en nouvelle plateforme média pour les marques

Test de la HUAWEI Watch Fit 5 Pro : l’Apple Watch de ceux qui ne veulent pas d’Apple Watch

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

OPPO Find X10 Pro : fuite sur un flagship avec double capteur 200 mégapixels et batterie 8 000 mAh

Redmi K90 Ultra : Snapdragon 8 Elite, ventilateur intégré et batterie géante de 8 500 mAh en approche

iPhone Ultra : Apple repousserait son premier iPhone pliable à 2027 pour mieux affronter Samsung

iOS 27 : trois fonctionnalités majeures encore absentes pourraient arriver avec l’iPhone 18 Pro

La DGSI abandonne Palantir : la France choisit ChapsVision pour renforcer sa souveraineté numérique

La France investit 655 millions d’euros dans une IA souveraine pour ses fonctionnaires

Mode verrouillé : pourquoi OpenAI limite volontairement les capacités de ChatGPT

Mistral AI viserait une levée de 3 milliards d’euros et une valorisation de 20 milliards

La DGSI abandonne Palantir : la France choisit ChapsVision pour renforcer sa souveraineté numérique

Microsoft lance les Surface Laptop 8 et Surface Pro 12 avec Snapdragon X2 et jusqu’à 20 heures d’autonomie

France Quantum 2026 : la France lance la plus grande course européenne à l’ordinateur quantique

La France investit 655 millions d’euros dans une IA souveraine pour ses fonctionnaires

WWDC 2026 : Apple ouvre Xcode 27 à Gemini, ChatGPT et Claude avec une nouvelle génération d’outils IA

GitLab restructure ses équipes pour miser sur les agents IA dans le développement logiciel

Figma ajoute son propre agent IA : le design collaboratif entre dans l’ère agentique

Google AI Studio permet désormais de créer des apps Android avec Gemini

Claude Cowork : Le guide complet pour automatiser votre quotidien en 2026

Intel Core Ultra vs Apple Silicon : Quelle philosophie choisir pour votre prochain bureau compact ?

Comment arrêter le suivi des e-mails dans Gmail ?

Claude Code vs ChatGPT Codex : Quel agent choisir pour votre workflow en 2026 ?

Google présente « MusicLM », un outil d’IA permettant de générer de la musique à partir de textes

Plusieurs fonctionnalités clés

Quel est l’avenir de l’IA ?

Les rendus du Huawei P60 Pro montrent un écran incurvé et un nouveau module de caméra arrière

Test de la Amazon Kindle Scribe : une grande liseuse qui fait également office de bloc-notes électronique

The author Yohann Poiron

Google présente « MusicLM », un outil d’IA permettant de générer de la musique à partir de textes

Plusieurs fonctionnalités clés

Quel est l’avenir de l’IA ?

The author Yohann Poiron

vous pourriez aussi aimer