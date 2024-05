La marche du progrès pour l’IA générative se transforme en un véritable sprint, et l’annonce et la publication par OpenAI de GPT-4o « Omni » promet de faire avancer ChatGPT et ses services connexes dans plusieurs domaines.

Si vous n’avez pas encore accès à GPT-4o, ce sera bientôt le cas. Voyons donc ce qui différencie ce nouveau modèle d’IA de ceux qui l’ont précédé.

GPT-4o contre GPT-4 Turbo et GPT-3.5

J’ai déjà abordé la différence entre GPT3.5 et GPT-4 Turbo, mais pour résumer, GPT-4 est nettement plus intelligent que GPT-3.5. Il est capable de comprendre beaucoup plus de nuances, de produire des résultats plus précis et est nettement moins sujet aux hallucinations de l’IA. GPT-3.5 est toujours d’actualité, car il est rapide, disponible gratuitement et peut encore gérer la plupart des tâches quotidiennes avec facilité. Tant que vous êtes conscient qu’il est beaucoup plus susceptible de vous donner des informations incorrectes.

GPT-4 Turbo a été le modèle phare jusqu’à l’arrivée de GPT-4o. Ce modèle n’était disponible que pour les abonnés de ChatGPT Plus et était livré avec tous les jouets amusants développés par OpenAI, tels que les GPT personnalisés et l’accès au Web en direct.

Avant d’aborder les caractéristiques et les capacités réelles, il est important de noter que (selon OpenAI) GPT-4o est deux fois moins cher et deux fois plus rapide que GPT-4. C’est probablement la raison pour laquelle GPT-4o est disponible à la fois pour les utilisateurs gratuits et payants, bien que les utilisateurs payants bénéficieront d’une limite d’utilisation cinq fois supérieure à celle de GPT-4o.

D’une manière générale, il est aussi intelligent que GPT-4 Turbo, de sorte que, dans l’ensemble, cette avancée est davantage axée sur l’efficacité. Cependant, il y a des avancées évidentes et moins évidentes qui vont au-delà du simple fait d’être plus rapide et moins cher.

Que peut faire GPT-4o ?

Le mot à la mode avec le GPT-4o est « multimodal », ce qui signifie que GPT-4o peut fonctionner avec de l’audio, des images, de la vidéo et du texte. Il en va de même pour le GPT-4 Turbo, mais cette fois-ci, c’est différent sous le capot.

OpenAI affirme avoir formé un seul réseau neuronal à toutes les modalités à la fois. Avec l’ancienne GPT-4 Turbo, en mode vocal, un modèle était utilisé pour convertir les mots prononcés en texte. GPT-4 interprétait ensuite ce texte et y répondait, puis le reconvertissait en une voix d’IA synthétisée.

Avec GPT-4o, il n’y a qu’un seul modèle, ce qui a de nombreuses répercussions sur les performances et les capacités. OpenAI affirme que le temps de réponse lors d’une conversation avec GPT-4o n’est plus que de quelques centaines de millisecondes, soit à peu près le même que lors d’une conversation en temps réel avec un autre humain. Si l’on compare ce temps de réponse aux 3 à 5 secondes que mettaient les anciens modèles, on constate qu’il s’agit d’un progrès considérable.

En plus d’être beaucoup plus rapide, GPT-4o peut désormais interpréter les éléments non verbaux de la parole, comme le ton de votre voix, et sa propre réponse a désormais une portée émotionnelle. Il peut même chanter ! En d’autres termes, OpenAI a donné à GPT-4o une certaine mesure de capacité informatique affective.

GPT-4o, pas encore disponible pour tous

Le même type d’efficacité et d’unification s’applique au texte et aux images, ainsi qu’à la vidéo. Dans une démo, GPT-4o est montré en train d’avoir une conversation en temps réel avec un être humain, avec vidéo et audio en direct. Tout comme lors d’une conversation vidéo avec un être humain, il apparaît que GPT-4o peut interpréter ce qu’il voit à travers la caméra et faire des déductions assez incisives.

ChatGPT-4o peut également garder à l’esprit un nombre beaucoup plus important de jetons que les modèles précédents, ce qui signifie qu’il peut appliquer son intelligence à des conversations beaucoup plus longues et à de plus grandes quantités de données. Cela le rendra probablement plus utile pour des tâches telles que l’aide à l’écriture d’un roman, par exemple.

À l’heure où j’écris ces lignes, toutes ces fonctionnalités ne sont pas encore accessibles au public, mais OpenAI a déclaré qu’elle les déploierait dans les semaines qui suivront l’annonce initiale et la sortie du modèle de base.

Combien coûte GPT-4o ?

GPT-4o est disponible pour les utilisateurs gratuits et payants, bien que les utilisateurs payants bénéficient de 5x la limite d’utilisation de GPT-4o.

À l’heure où j’écris ces lignes, le coût de ChatGPT Plus est toujours de 20 dollars par mois, et si vous êtes un développeur, vous devrez vérifier les coûts de l’API pour vos besoins, mais GPT-4o devrait être beaucoup moins cher comparé à d’autres modèles.

Comment utiliser GPT-4o ?

Comme je l’ai mentionné ci-dessus, GPT-4o est disponible pour les utilisateurs gratuits et payants, mais toutes ses fonctionnalités ne sont pas disponibles immédiatement. Par conséquent, selon le moment où vous lirez ces lignes, les choses exactes que vous pourrez faire avec le logiciel varieront. Cela dit, l’utilisation de GPT-4o est très simple. Si vous utilisez le site ChatGPT en tant qu’abonné ChatGPT Plus, cliquez simplement sur le menu déroulant qui affiche le nom du modèle actuel et sélectionnez GPT-4o.

Si vous êtes un utilisateur gratuit, vous serez dirigé par défaut vers ChatGPT-4o jusqu’à ce que vous ayez épuisé votre allocation. À ce moment-là, vous serez ramené à la version 3.5 jusqu’à ce que vous ayez plus de demandes disponibles.

Si vous utilisez l’application mobile, appuyez simplement sur les trois points et choisissez le modèle à partir de là.

Ensuite, utilisez ChatGPT comme vous le feriez habituellement !

Lorsque GPT-4o sera disponible dans sa forme finale, nous pourrions enfin obtenir l’assistant conversationnel en langage naturel que la science-fiction nous a promis. Je vous laisse le soin de décider si c’est une bonne ou une mauvaise chose, mais c’est en tout cas très excitant !