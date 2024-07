Certains membres de ChatGPT Plus peuvent commencer à utiliser le mode vocal avancé, mais d’autres devront attendre des mois.

Présenté pour la première fois en mai dans le cadre du lancement de GPT-4o, le mode vocal avancé de ChatGPT promet la possibilité de créer des voix de personnages personnalisables ou d’agir en tant que traducteur en direct. Certains utilisateurs de ChatGPT Plus semblent déjà avoir accès à la nouvelle fonctionnalité, ce qui suggère que le déploiement a commencé — mais pas aussi complètement qu’on pourrait l’espérer.

Lors de l’événement organisé par OpenAI, le nouveau mode vocal s’est avéré nettement plus performant que le mode vocal actuel de ChatGPT. Sur scène, les employés d’OpenAI ont pu interrompre le chatbot et lui demander de raconter une histoire de différentes manières, et le chatbot a profité de ces interruptions pour ajuster ses réponses.

Sam Altman, PDG d’OpenAI, a promis un déploiement « la semaine prochaine » lorsqu’il a été interrogé sur X, précisant que les abonnés Plus seraient les premiers à accéder au mode vocal avancé. Les utilisateurs se sont rendus sur le subreddit ChatGPT de reddit pour partager un nouveau message au bas de l’application ChatGPT, qui se lit comme suit : « Le mode vocal avancé arrive ». « Notre déploiement du mode vocal avancé a commencé, et nous enrôlons lentement les utilisateurs dans l’alpha pour assurer la qualité de l’expérience », poursuit le message. « Tous les utilisateurs Plus y auront accès d’ici la fin de l’automne — nous vous le ferons savoir dès que vous en ferez partie ».

La fin de l’automne pourrait être aussi tardive que novembre et le message est suffisamment vague pour englober n’importe quelle période avant la fin de l’année. Si vous voulez être prudent, vous pouvez opter pour « d’ici la fin de l’année 2024 », qui est une date plus réaliste.

Pourquoi le mode vocal avancé arrive-t-il plus tard ?

OpenAI a fait une déclaration publique sur le X en juin, précisant que des problèmes de sécurité avaient entraîné un retard dans le déploiement du mode.

« Nous avions prévu de commencer à déployer ce mode en version alpha auprès d’un petit groupe d’utilisateurs de ChatGPT Plus à la fin du mois de juin, mais nous avons besoin d’un mois supplémentaire pour atteindre notre barre de lancement », peut-on lire sur X. « Nous améliorons par exemple la qualité de la voix et de l’image, ce qui nous permet d’être plus efficaces. Par exemple, nous améliorons la capacité du modèle à détecter et à refuser certains contenus. Nous travaillons également à l’amélioration de l’expérience utilisateur et à la préparation de notre infrastructure pour qu’elle puisse évoluer vers des millions d’utilisateurs tout en maintenant des réponses en temps réel ».

L’entreprise semble s’en être tenue à cette extension d’un mois, puisqu’un déploiement au moins partiel a eu lieu presque exactement un mois plus tard.

Lors de l’événement organisé par OpenAI, l’une des principales critiques formulées à l’encontre du nouveau mode a été la ressemblance de la voix sur scène, baptisée « Sky », avec celle de Johansson, qui a joué le rôle d’une personnalité IA dans le film Her. Bien que la voix ait été présente dans ChatGPT avant la démonstration d’OpenAI au printemps, l’entreprise l’a retirée peu après que Johansson a révélé avoir envoyé des lettres à OpenAI pour demander comment la voix avait été fabriquée. Christianson précise que le nouveau mode de ChatGPT n’utilisera que 4 voix prédéfinies qu’il a créées avec des acteurs vocaux, ajoutant : « Nous avons fait en sorte que ChatGPT ne puisse pas se faire passer pour la voix d’autres personnes, qu’il s’agisse d’individus ou de personnalités publiques, et qu’il bloque les sorties qui diffèrent de l’une de ces voix prédéfinies ».