Sora : Créez des vidéos époustouflantes avec l’IA d’OpenAI

par Yohann Poiron le 10 décembre 2024

Dans le cadre de son événement « 12 Days of OpenAI », également surnommé « ship-mas », OpenAI a officiellement lancé Sora, son modèle avancé de génération vidéo par IA.

Disponible dès aujourd’hui sur sora.com pour les abonnés ChatGPT Plus et Pro aux États-Unis et dans de nombreux pays, ce lancement marque une étape majeure dans l’innovation text-to-video.

Sora Turbo : des fonctionnalités avancées pour des créations IA riches

La version améliorée, appelée Sora Turbo, ajoute plusieurs fonctionnalités puissantes :

Génération vidéo à partir de texte : Créez des clips vidéo à partir de descriptions textuelles.
Animation d’images : Transformez des photos en vidéos animées.
Remix vidéo : Modifiez les résultats générés par Sora avec des invites textuelles ou fusionnez des scènes en utilisant l’intelligence artificielle.

Capacités des abonnements ChatGPT

1. Abonnement Plus (20 dollars/mois)

Génération jusqu’à 50 vidéos prioritaires (1 000 crédits).
Résolutions allant jusqu’à 720p.
Durée des vidéos limitée à 5 secondes.

2. Abonnement Pro (200 dollars/mois)

Générations illimitées avec jusqu’à 500 vidéos prioritaires.
Résolutions jusqu’à 1080p.
Durées vidéo étendues à 20 secondes.
Téléchargements sans watermark.
Jusqu’à cinq générations simultanées pour des projets plus intensifs.

Des outils interactifs pour libérer la créativité

Page Explore

Une nouvelle page Explore permet aux utilisateurs de parcourir un flux de vidéos générées par d’autres membres de la communauté Sora. Ce partage vise à inspirer les créateurs et à montrer l’étendue des possibilités du modèle.

Storyboards et remix

Mode Storyboards : Génération de vidéos à partir d’une séquence de prompts textuels, avec des transitions fluides entre les scènes.
Outil Remix : Ajustez les vidéos générées en affinant les résultats avec de nouvelles instructions textuelles.
Fonction Blend : Fusionnez deux scènes pour une transition harmonieuse, idéale pour les narrations complexes.

Transparence et modération : une approche prudente

Toutes les vidéos générées via Sora incluront des watermarks visibles et des métadonnées C2PA pour indiquer leur origine IA. Lors du téléchargement de médias (images ou vidéos), les utilisateurs doivent accepter des conditions strictes :

Aucune personne mineure, contenu explicite ou matériel protégé par des droits d’auteur.
Les abus peuvent entraîner la suspension ou le bannissement du compte.

Aditya Ramesh, vice-président de la recherche chez OpenAI, a reconnu l’importance d’une modération équilibrée : « Nous avons un grand défi à relever, car nous voulons empêcher les abus tout en permettant une expression créative. Nous débutons avec prudence, mais nous sommes ouverts aux retours pour nous améliorer ».

Limitations géographiques

Si Sora est disponible aujourd’hui aux États-Unis et dans de nombreux autres pays, l’Europe et le Royaume-Uni devront attendre. Selon Sam Altman, PDG d’OpenAI, cela pourrait prendre un certain temps avant que le modèle ne soit lancé dans ces régions en raison de réglementations spécifiques.

Une semaine avant le lancement, des artistes participant au programme alpha de Sora ont diffusé le modèle en ligne en signe de protestation contre ce qu’ils ont qualifié de travail non rémunéré pour la R&D et le marketing d’OpenAI.

Avec Sora, OpenAI redéfinit la création vidéo par IA en offrant des outils puissants et accessibles pour les créateurs. Malgré ses limitations géographiques et techniques initiales, l’intégration de fonctionnalités comme le remix, les storyboards et l’animation d’images ouvre de nouvelles possibilités créatives.

Cependant, les défis de modération, la concurrence accrue et les critiques sur le programme de testeurs alpha rappellent qu’OpenAI doit encore affiner son approche pour garantir un succès durable. Pour l’instant, Sora Turbo pose les bases d’une innovation qui pourrait transformer la vidéo générée par IA.

Lire plus

Intelligence Artificielle

ChatGPT : Deux ans après, l’IA générative n’est que la pointe de l’iceberg

par Yohann Poiron le 9 décembre 2024

Cela fait un peu plus de deux ans que ChatGPT a été lancé le 30 novembre 2022. Initialement conçu comme un projet de démonstration pour explorer l’utilisation des modèles de langage de grande ampleur (LLM), ChatGPT a rapidement dépassé les attentes. OpenAI ne s’attendait pas à ce que l’outil atteigne 100 millions d’utilisateurs en seulement 2 mois, marquant ainsi un tournant pour l’adoption massive de l’IA.

Les Large Language Model, comme ChatGPT, reposent sur une architecture de type transformer, introduite par Google en 2017. Cette technologie, basée sur des mécanismes d’auto-attention, permet de comprendre et de générer du texte de manière quasi humaine. Si la montée en puissance de ChatGPT était impressionnante, elle était peut-être prévisible.

Depuis le lancement de ChatGPT, un véritable « Big Bang » de l’IA a eu lieu, entraînant une explosion des startups utilisant des technologies génératives. Le phénomène a également catalysé l’émergence de produits comme Gemini de Google, intégré dans la recherche et d’autres produits phares de l’entreprise.

L’impact généralisé de l’IA générative impulsée par ChatGPT

La popularité de ChatGPT a déclenché une vague d’intérêt pour l’IA générative, une catégorie regroupant les LLM pour le texte et les modèles de diffusion pour les images. En 2023, cette technologie a atteint ce que Gartner appelle le « Pic des attentes exagérées ». Cependant, malgré un léger recul dans l’engouement, l’IA générative continue de bouleverser les industries.

Selon des estimations, le nombre d’entreprises axées sur l’IA dans le monde a doublé depuis 2017 pour atteindre environ 70 000 en 2024. Aux États-Unis, le financement des startups IA a explosé, atteignant 27,1 milliards de dollars au deuxième trimestre 2024, représentant près de 50 % des investissements en capital-risque.

Une adoption inégale entre consommateurs et entreprises

Malgré l’engouement, l’adoption de l’IA générative reste modérée chez les consommateurs individuels. Une enquête de Reuters Institute révèle qu’en 2024, l’utilisation quotidienne de ChatGPT varie de 1 % au Japon à 2 % en France. Parmi les freins : un manque de sensibilisation et des préoccupations liées à la confidentialité.

En revanche, le secteur entreprise adopte rapidement ces technologies. D’après GAI Insights, 33 % des entreprises auront des applications d’IA générative en production dès 2025. Les cas d’usage incluent amélioration du service client, automatisation des workflows, aide à la prise de décision.

Des secteurs comme la santé ou les services financiers utilisent déjà l’IA pour capturer des notes ou détecter les fraudes.

Vers l’intelligence artificielle générale (AGI)

Les perspectives de l’IA vont bien au-delà des outils génératifs. OpenAI et Anthropic estiment que nous pourrions voir les premiers signes d’intelligence artificielle générale (AGI) dès 2025. L’AGI correspond à la capacité d’un système à accomplir toutes les tâches intellectuelles humaines, marquant une étape clé dans l’autonomie des machines.

Des entreprises comme Anthropic et Salesforce travaillent déjà sur des agents IA capables de gérer des tâches complexes. Par exemple, la fonctionnalité Computer Use de Claude permet à l’IA d’interagir avec des interfaces utilisateur pour planifier des rendez-vous ou analyser des données. Salesforce intègre également ces agents pour automatiser des tâches répétitives, libérant du temps pour des travaux stratégiques.

Selon Gartner, d’ici 2028, 33 % des logiciels d’entreprise intégreront une IA agentique, prenant en charge 15 % des décisions quotidiennes.

L’intelligence ambiante : l’intégration totale de l’IA

Le concept d’intelligence ambiante, où l’IA s’intègre de manière transparente dans nos vies quotidiennes, est également en pleine émergence. Cela inclut l’interconnexion des technologies pour offrir des expériences fluides et contextuelles. Ce qui semblait utopique en 2016 est sur le point de devenir une réalité.

Les défis à venir

Si l’IA promet des avancées majeures, elle apporte aussi des défis considérables :

Disruption du marché de l’emploi : Une adoption rapide de l’IA pourrait entraîner des pertes d’emplois, notamment en période de récession.
Risques éthiques et sociaux : La montée en puissance de l’IA soulève des questions sur la protection des données, les biais algorithmiques et l’équité.

En parallèle, les opportunités sont immenses :

Découvertes médicales révolutionnaires
Robots humanoïdes pratiques
Agriculture de précision

L’évolution de l’IA, de ChatGPT à l’émergence potentielle de l’AGI, marque une ère de transformation sans précédent. Alors que ces technologies redéfinissent les industries et nos modes de vie, elles posent également des défis fondamentaux. Les années à venir détermineront si l’IA amplifie notre potentiel ou si elle crée des perturbations majeures. Une chose est sûre : l’IA façonnera profondément l’avenir de l’humanité.

Lire plus

Intelligence Artificielle

Apple Intelligence en Chine : Un lancement compromis par les difficultés avec Baidu ?

par Yohann Poiron le 9 décembre 2024

Lancée sans Apple Intelligence, l’iPhone 16 a suscité des frustrations chez les utilisateurs chinois, d’autant plus que les fonctionnalités d’IA tant attendues sont restées absentes du marché chinois, même après leur déploiement mondial.

Aujourd’hui, il apparaît que Apple tente de combler cette lacune, mais fait face à des défis majeurs dans l’intégration de ses outils d’IA en Chine.

Pour ses services d’IA, Apple utilise un LLM (Large Language Model) propriétaire dans le reste du monde. Cependant, ce modèle ne sera pas utilisé en Chine, vraisemblablement en raison de contraintes réglementaires et de spécificités locales.

À la place, Apple collabore avec le géant chinois Baidu pour s’appuyer sur son propre modèle d’IA. Mais cette collaboration est loin d’être fluide pour deux raisons principales :

Un modèle Baidu en deçà des attentes d’Apple : Baidu, qui est derrière le modèle Ernie Bot, peine à répondre aux exigences de qualité d’Apple. Selon des sources, l’IA de Baidu comprend mal de nombreuses requêtes et échoue souvent à accomplir des tâches de base, ce qui rend l’expérience utilisateur insatisfaisante.
Un conflit sur la gestion des données : Apple, qui a bâti sa réputation sur la protection des données personnelles, refuse que les informations des utilisateurs soient collectées ou analysées. Or, Baidu souhaite accéder à ces données pour améliorer ses modèles et les utiliser à d’autres fins. Ce désaccord place les deux entreprises dans une impasse qui ralentit le déploiement de l’IA d’Apple en Chine.

Un marché stratégique, mais en déclin pour Apple

La Chine représente une part importante des ventes d’Apple, mais l’intérêt pour les produits de la marque y a récemment diminué. Une partie de cette baisse pourrait être attribuée à l’iPhone 16, jugé incomplet en raison de l’absence des outils d’IA comme Apple Intelligence. Apple doit impérativement proposer ces fonctionnalités aux consommateurs chinois pour maintenir sa compétitivité face à des concurrents comme Huawei, qui a récemment vu ses parts de marché grimper grâce à des innovations locales.

Le lancement mondial de l’iPhone 16 a mis en lumière une approche fragmentée de la part d’Apple, avec certaines régions bénéficiant de fonctionnalités que d’autres n’ont pas. Cette disparité, combinée aux retards dans le déploiement de l’IA en Chine, semble être une erreur stratégique majeure.

Les consommateurs s’attendent à une expérience cohérente, et le fait qu’Apple n’ait pas anticipé ces obstacles — qu’ils soient techniques ou liés à la réglementation — a nui à la perception de la marque.

Que peut faire Apple ?

Deux options se présentent à Apple :

Rompre ses liens avec Baidu et trouver une autre solution, bien que cela risque de retarder encore davantage le lancement.
Revoir ses politiques de confidentialité pour s’aligner sur les exigences de Baidu, mais cela pourrait compromettre son image de champion de la vie privée.

Apple doit rapidement résoudre ces problèmes pour éviter une érosion de sa base d’utilisateurs chinois, un marché clé où l’entreprise a déjà vu ses parts de marché diminuer. À l’avenir, une meilleure préparation et une stratégie globale cohérente seront essentielles pour éviter de tels échecs.

Lire plus

Intelligence Artificielle

Grok 2 + Aurora Beta : Génération d’images photoréalistes sur X

par Yohann Poiron le 9 décembre 2024

X, la plateforme dirigée par Elon Musk, continue d’améliorer ses capacités en intelligence artificielle avec l’introduction d’un nouveau modèle de génération d’images nommé Aurora. Conçu pour fonctionner avec Grok, l’assistant IA de la plateforme, Aurora promet de produire des images beaucoup plus photoréalistes que les générateurs précédents, bien que ses restrictions semblent tout aussi légères, selon un rapport de TechCrunch.

Aurora est accessible via l’option « Grok 2 + Aurora beta » dans le sélecteur de modèles Grok. Cependant, comme avec d’autres fonctionnalités de Grok, les utilisateurs n’ont droit qu’à un nombre limité de requêtes gratuites avant de se heurter à un mur d’abonnement X Premium. Les utilisateurs qui souhaitent dépasser ces limites devront patienter ou souscrire au service payant.

xAI doesn’t need to wait until Monday. This team is too cracked and stays shipping.

Congrats @xai for releasing a brand new image gen model —Aurora!

Grok 2 + Aurora is now available with your X app in the model selector.

Oh, by the way, Grok 3 is coming. 🚀 https://t.co/l92HwU4q9e

— Chris Park (@chrisparkX) December 7, 2024

TechCrunch rapporte que Aurora peut générer des images de haute qualité, y compris des portraits photoréalistes, mais avec des résultats parfois dérangeants en termes d’anatomie ou de cohérence.

Par exemple, des images réalistes de célébrités comme Ray Romano et Adam Sandler montrent des visages convaincants, bien que certains détails, comme les proportions corporelles, soient imparfaits.

Behold my images using the new Grok @grok image generator Aurora: 🧵

1. Ray Romano and @AdamSandler on a sitcom set pic.twitter.com/2V491RdjMF

— Matt (@EnsoMatt) December 7, 2024

Aurora semble également avoir peu de restrictions en matière de contenu. Le modèle est capable de générer des images de personnages sous copyright ou de figures publiques, comme Mickey Mouse ou un Donald Trump ensanglanté, bien qu’il s’arrête à produire des images explicites ou nues. Cette absence de limites strictes n’est pas surprenante, étant donné les précédentes expériences avec les modèles d’IA de Grok.

Implications et débats éthiques autour de Grok

La capacité d’Aurora à générer des images de personnalités publiques et de contenus sous copyright soulève des préoccupations éthiques et juridiques. Bien que ces fonctionnalités puissent attirer les utilisateurs, elles risquent d’entraîner des controverses similaires à celles rencontrées par d’autres plateformes d’IA générative. X devra peut-être ajuster ses règles pour éviter les litiges ou les abus.

Avec Aurora, X démontre son ambition de rivaliser avec des outils d’IA générative comme DALL-E 3 ou MidJourney, tout en s’appuyant sur l’intégration unique à Grok. Bien que prometteur, le modèle reste sujet à des limitations en termes de continuité et d’éthique, laissant place à des ajustements futurs. Pour les utilisateurs, Aurora est une opportunité intéressante de tester des outils puissants, mais avec précaution face aux possibles dérives.

Lire plus

Intelligence Artificielle

OpenAI : Vers l’AGI et la superintelligence, mais « cela importera peu », selon Altman

par Yohann Poiron le 8 décembre 2024

En mai 2023, Sam Altman, PDG d’OpenAI, témoignait devant le Sénat américain pour exhorter les législateurs à réguler l’intelligence artificielle (IA) afin d’éviter des « préjudices significatifs pour le monde ». À l’époque, il avait déclaré : « Si cette technologie dérape, cela pourrait aller très mal ».

Mais lors du sommet DealBook organisé par The New York Times, Sam Altman semble avoir révisé son discours sur les dangers associés à l’AGI (Intelligence Artificielle Générale) — une IA avancée capable de rivaliser ou surpasser les capacités humaines.

AGI : Moins d’impact qu’on ne le pense ?

Altman a affirmé lors du sommet :

Mon intuition est que nous atteindrons l’AGI plus tôt que la majorité des gens ne le pense, mais cela importera beaucoup moins. Beaucoup des préoccupations de sécurité que nous et d’autres avons soulevées n’interviendront pas à ce moment précis. L’AGI pourrait être construite, et le monde continuerait pratiquement de la même manière. L’économie s’accélérera, les choses croîtront plus vite.

Il a ajouté : « Cependant, il y aura une longue transition entre ce que nous appelons AGI et ce que nous appelons Superintelligence ».

Certains analystes estiment que OpenAI essaie de réorienter l’attention publique de l’AGI vers la Superintelligence, en partie pour rediscuter son partenariat exclusif avec Microsoft.

OpenAI et Microsoft ont une clause dans leur accord stipulant que si OpenAI atteint l’AGI, Microsoft perdrait l’accès exclusif aux technologies de l’entreprise. Selon un rapport du Wall Street Journal, les dirigeants d’OpenAI perçoivent cette clause AGI comme un levier pour redéfinir ou mettre fin à l’accord avec Microsoft.

Altman a reconnu une certaine friction entre les deux entreprises : « Il y a des tensions, mais dans l’ensemble, je pense que nos incitations sont plutôt alignées ».

Les pressions d’Elon Musk et le débat autour de l’AGI

Une autre raison pour laquelle Sam Altman pourrait minimiser les craintes liées à l’AGI serait liée à une plainte déposée par Elon Musk contre OpenAI. Musk s’inquiète de la concentration du pouvoir d’OpenAI autour de l’AGI, surtout après la transformation de l’entreprise en entité à but lucratif. Il craint que l’absence de garde-fous adéquats ne mène à des conséquences catastrophiques.

Sam Altman, lors du sommet DealBook, a également fait référence à Musk et à ses relations avec le président élu Donald Trump : « Je crois fermement qu’Elon fera ce qui est juste. Il serait profondément contraire aux valeurs américaines d’utiliser le pouvoir politique pour nuire à ses concurrents et favoriser ses propres entreprises ».

OpenAI : Des annonces imminentes et Sora en approche ?

Sam Altman a laissé entendre que l’entreprise travaillait sur des projets à long terme concernant l’AGI et la Superintelligence. Il a aussi révélé que OpenAI avait prévu 12 jours de célébration, à compter d’aujourd’hui, avec des lancements de produits, des démonstrations et de nouvelles fonctionnalités. Parmi ces innovations, des rumeurs indiquent qu’OpenAI pourrait enfin dévoiler Sora, son très attendu générateur de texte vers vidéo, d’ici la fin de l’année.

L’évolution de l’AGI et ses implications restent à surveiller de près, alors qu’OpenAI et ses partenaires s’efforcent de définir ce que sera l’avenir de l’intelligence artificielle mondiale.

Lire plus

Intelligence Artificielle

Llama 3.3 : L’IA multilingue performante et économique de Meta

par Yohann Poiron le 7 décembre 2024

Meta continue d’innover dans le domaine de l’intelligence artificielle avec le lancement du modèle Llama 3.3 70B, une version optimisée de son modèle IA le plus avancé. Ce modèle, destiné à des usages commerciaux et de recherche, peut désormais être téléchargé pour être exécuté localement sur des machines compatibles.

Cependant, la puissance requise pour une utilisation optimale le rend inaccessible à la majorité des PC grand public.

Avec 70 milliards de paramètres, Llama 3.3 70B offre des performances comparables au modèle Llama 3.1 405B de Meta tout en nécessitant des ressources matérielles réduites. Cela représente un progrès significatif en termes d’efficacité, rendant cette IA plus accessible à des utilisateurs ayant des configurations matérielles robustes, mais non spécialisées.

Avec un poids de fichier de 37,14 Go, le modèle exige toutefois une configuration matérielle avancée, notamment 64 Go de RAM pour fonctionner de manière fluide. De plus, une GPU puissante (ou plusieurs connectées) est nécessaire pour traiter les tâches complexes qu’il peut exécuter.

Pour mettre cela en perspective, le modèle Llama 3.1-405B demandait entre 243 Go et 1944 Go de mémoire GPU, tandis que le nouveau Llama 3.3 réduit cette charge de manière significative. Selon des estimations, les économies en coûts initiaux de GPU pourraient atteindre 600 000 dollars, sans compter les réductions en consommation énergétique.

Différentes tailles pour différents usages

Préentraîné sur 15 trillions de tokens de données publiques et affiné grâce à plus de 25 millions d’exemples générés synthétiquement, Llama 3.3 surpasse ses concurrents dans plusieurs benchmarks. Par exemple, il atteint un taux de précision de 91,1 % sur MGSM, démontrant sa maîtrise des langues comme l’allemand, le français, l’italien, le hindi, le portugais, l’espagnol et le thaï, en plus de l’anglais.

Le modèle intègre une fenêtre de contexte étendue à 128k tokens, permettant la génération de contenu long comme des livres ou des rapports complexes. Des innovations architecturales comme Grouped Query Attention (GQA) améliorent sa scalabilité et ses performances en phase d’inférence.

Meta propose le modèle Llama en plusieurs tailles de paramètres pour répondre à différents besoins.

Llama 3.2 1B : Modèle léger pour des tâches basiques, fonctionnant rapidement sur des smartphones.
Llama 3.2 11B et 90B : Conçus pour des performances supérieures, idéaux pour des PC et serveurs haut de gamme.
Llama 3.3 70B : Une version optimisée pour des machines locales tout en offrant des performances proches du modèle 405B, qui exigeait une infrastructure très coûteuse.

Grâce aux avancées en optimisation post-entraînement, Meta a réussi à réduire les coûts d’inférence tout en améliorant les capacités de génération et de compréhension linguistiques.

Applications et capacités

Le modèle Llama 3.3 70B est conçu pour :

Les tâches de génération de texte : Idéal pour les assistants conversationnels et les outils de traitement naturel du langage.
L’optimisation d’autres modèles : Il peut générer des données synthétiques pour affiner des IA ou des tâches spécifiques.
La prise en charge multilingue : Llama 3.3 est optimisé pour plusieurs langues, facilitant son adaptation à divers marchés et contextes.

Ce modèle peut également être adapté à des usages plus créatifs et spécialisés grâce à sa capacité à être affiné avec des instructions pour des applications uniques, allant des agents conversationnels intelligents à la génération de contenu complexe.

Configurations matérielles recommandées

Bien que plus accessible que son prédécesseur de 405B paramètres, le Llama 3.3 70B nécessite tout de même une configuration puissante pour fonctionner efficacement :

64 Go de RAM ou plus pour exécuter le modèle dans de bonnes conditions.
Une ou plusieurs GPU de haute performance, comme les Nvidia RTX 3090, 4090 ou équivalents.
Disque de stockage rapide pour charger le fichier volumineux rapidement.

Pour les configurations moins robustes, Meta propose des versions plus petites, comme les modèles 1B, 3B et 8B, qui peuvent fonctionner sur des ordinateurs portables classiques équipés de 8 à 16 Go de RAM.

En termes de coût d’utilisation, Llama 3.3 est particulièrement compétitif, avec des coûts de génération de texte aussi bas que 0,01 dollar par million de tokens, le rendant plus abordable que des solutions comme GPT-4 ou Claude 3.5. Meta met également en avant son engagement environnemental. Bien que l’entraînement du modèle ait généré 11 390 tonnes de CO2 équivalent, l’entreprise a compensé ses émissions grâce à des initiatives en énergies renouvelables, atteignant des émissions nettes nulles pour cette phase.

Comment télécharger et utiliser Llama 3.3 70B ?

Le modèle est disponible au téléchargement sur plusieurs plateformes : Site officiel de Meta, Hugging Face, GitHub et d’autres dépôts spécialisés. Les utilisateurs peuvent également s’appuyer sur des applications comme LM Studio ou Nvidia Chat With RTX pour tester et déployer les modèles sur leurs propres appareils.

Le Llama 3.3 70B offre une opportunité unique aux développeurs et chercheurs souhaitant exploiter des capacités avancées d’IA directement sur leur matériel. Bien que les exigences matérielles restent élevées, cette version représente une avancée vers des modèles puissants et accessibles pour un usage local.

Pour les utilisateurs disposant d’une configuration adaptée, ce modèle ouvre la voie à des applications innovantes dans des domaines variés, tels que l’analyse de texte, la traduction, ou encore la recherche assistée par IA. Pour les autres, les versions plus légères restent une excellente alternative pour découvrir la puissance de Llama.

Lire plus

Intelligence Artificielle

Grok AI : xAI lance une version gratuite de son chatbot IA sur X

par Yohann Poiron le 7 décembre 2024

Grok, le chatbot basé sur l’intelligence artificielle d’Elon Musk, devient plus accessible : les utilisateurs non-abonnés à la version Premium de X (anciennement Twitter) peuvent désormais interagir avec Grok gratuitement.

Cette nouveauté permet à ces utilisateurs d’envoyer jusqu’à 10 messages toutes les 2 heures au chatbot.

Lancé l’année dernière par xAI, Grok se distingue comme un assistant IA humoristique, initialement réservé aux abonnés Premium de X. En août, xAI a ajouté une fonctionnalité de génération d’images à partir de texte, mais cette nouveauté a parfois produit des résultats controversés.

En novembre, xAI a commencé à tester une version gratuite de Grok dans certaines régions, un développement qui s’aligne désormais avec cette disponibilité plus large. Cette décision pourrait permettre à Grok de mieux rivaliser avec des chatbots déjà gratuits, comme ChatGPT (OpenAI), Google Gemini, Microsoft Copilot, ou Claude d’Anthropic.

Grok, la stratégie pour concurrencer les leaders du marché IA

Malgré son positionnement initial comme outil Premium, l’extension de l’accès à Grok vise à attirer un plus grand nombre d’utilisateurs. Le marché des chatbots étant hautement compétitif, l’offre gratuite pourrait inciter davantage de personnes à essayer cette IA, ce qui augmenterait son adoption et son attrait global.

De plus, xAI explore le développement d’une application autonome dédiée à Grok, rejoignant ainsi les approches déjà adoptées par OpenAI (ChatGPT), Google (Gemini), et Anthropic (Claude).

Une IA financée à hauteur de 6 milliards de dollars

Avec 6 milliards de dollars levés lors de son dernier tour de table, xAI dispose de ressources considérables pour améliorer Grok et soutenir sa croissance. L’entreprise cherche à consolider son offre face à des acteurs établis tout en explorant de nouvelles fonctionnalités et opportunités pour se démarquer.

La décision d’offrir une version gratuite de Grok reflète un ajustement stratégique visant à élargir son audience et à s’imposer dans un marché dominé par des géants de la technologie. Reste à voir si cette initiative réussira à faire de Grok une alternative viable et compétitive dans l’écosystème des chatbots.

Lire plus

Intelligence Artificielle

ChatGPT Pro : Performances boostées et mode « o1 pro » exclusif à 200 euros/mois

par Yohann Poiron le 6 décembre 2024

OpenAI a donné le coup d’envoi de sa campagne « 12 Days of OpenAI » en introduisant ChatGPT Pro, un abonnement haut de gamme destiné aux chercheurs, ingénieurs, programmeurs et utilisateurs avancés.

Ce nouveau plan, proposé à 200 dollars par mois, inclut le tout nouveau modèle o1, qui remplace le modèle précédent o1-preview, et introduit une exclusivité : le mode o1 pro.

Qu’est-ce que le ChatGPT Pro ?

Avec l’abonnement ChatGPT Pro, les utilisateurs bénéficient de :

Accès illimité à o1, o1-mini, GPT-4o et au Mode vocal avancé.
Accès exclusif au mode o1 pro, un modèle plus puissant qui utilise davantage de ressources informatiques pour résoudre des problèmes complexes nécessitant une intelligence de niveau recherche.

Contrairement à ChatGPT Plus (20 dollars/mois), qui offre également l’accès au modèle complet o1, le mode o1 pro reste réservé aux abonnés Pro. Ce mode est conçu pour traiter les questions les plus ardues avec une fiabilité et une profondeur d’analyse accrues.

Performances du modèle o1 et du mode o1 pro

OpenAI a révélé d’impressionnants benchmarks pour le nouveau modèle :

Benchmark	o1-pro	o1-preview
AIME 2024	86 points	50 points
Codeforces	90 points	62 points
GPQA Diamond	79 points	74 points

Ces résultats montrent que le modèle o1 et son mode avancé offrent des performances nettement supérieures et une fiabilité accrue. Le mode o1 pro, grâce à ses ressources de calcul supplémentaires, excelle dans les problèmes complexes nécessitant une analyse approfondie.

Optimisations et nouveautés

Temps de réponse amélioré

Le modèle o1 répond rapidement aux questions simples.
Pour les questions complexes, le temps de réponse reste inférieur à celui de o1-preview, tout en offrant une analyse détaillée.
Le mode o1 pro, bien qu’il prenne plus de temps pour répondre, garantit des résultats fiables. Un barre de progression s’affiche pendant le traitement, et une notification est envoyée une fois la réponse prête.

Entrée multimodale

Le modèle o1 prend désormais en charge les images. Les utilisateurs peuvent télécharger une image et recevoir des réponses ou analyses basées sur le traitement multimodal de l’IA.

Fonctionnalités à venir

OpenAI a annoncé l’ajout prochain de :

Navigation web.
Téléversement de fichiers.
Intégrations API enrichies.

Disponibilité et accessibilité

Le modèle complet o1 est disponible dès aujourd’hui pour les abonnés ChatGPT Plus et Pro, avec un déploiement progressif. Le mode o1 pro, exclusif à ChatGPT Pro, est immédiatement disponible pour les utilisateurs ayant souscrit à cette nouvelle offre.

Avec le lancement de ChatGPT Pro et les avancées du modèle o1, OpenAI répond aux besoins des utilisateurs professionnels et des chercheurs. L’entreprise continue d’établir des normes élevées dans le domaine de l’IA, tout en préparant l’arrivée d’autres innovations dans le cadre de sa campagne « 12 Days of OpenAI ».

Lire plus

Intelligence Artificielle

GenCast : L’IA de Google révolutionne les prévisions météorologiques

par Yohann Poiron le 5 décembre 2024

Google DeepMind a présenté GenCast, un modèle d’IA haute résolution conçu pour améliorer considérablement la précision et l’efficacité des prévisions météorologiques.

Capable de prédire les événements climatiques quotidiens et extrêmes jusqu’à 15 jours à l’avance, GenCast surpasse déjà le système ENS (Ensemble Prediction System) du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT). Cette avancée place l’IA comme un outil incontournable en météorologie, répondant à des défis cruciaux, tels que la prévision des phénomènes extrêmes et la planification des énergies renouvelables.

Les caractéristiques clés de GenCast

Prévisions par ensembles pilotées par l’IA

GenCast utilise une approche de prévisions par ensembles, générant plus de 50 scénarios météorologiques pour fournir une gamme d’issues possibles. Contrairement aux modèles traditionnels qui offrent une seule prévision, cette méthode prend en compte les incertitudes, améliorant ainsi la fiabilité des prévisions.

Basé sur un modèle de diffusion, souvent utilisé dans la génération d’images et de vidéos par l’IA, GenCast est spécialement conçu pour s’adapter à la géométrie sphérique de la Terre. Cette adaptation unique permet de cartographier avec précision des schémas météorologiques complexes.

Entraînement sur des décennies de données historiques

GenCast a été entraîné à partir de 40 années de données issues des archives ERA5 du CEPMMT. Ces données incluent des variables essentielles, telles que la température, la vitesse du vent et la pression atmosphérique à différentes altitudes, garantissant des prévisions fiables et précises.

Avec une résolution de 0,25 degré, GenCast offre des prévisions météorologiques détaillées. Il a surpassé le système ENS dans 97,2 % des cas et a atteint une précision exceptionnelle de 99,8 % pour des prévisions au-delà de 36 heures.

Efficacité informatique avec Google Cloud TPU

GenCast se distingue par son efficacité en matière de calcul. Grâce à un seul Google Cloud TPU v5, le modèle peut générer une prévision de 15 jours en seulement 8 minutes, une tâche qui nécessiterait normalement des supercalculateurs et plusieurs heures de traitement.

GenCast excelle dans la prévision des phénomènes météorologiques extrêmes, tels que les vagues de chaleur, les épisodes de froid intense, les vents violents et les cyclones tropicaux, comme les ouragans et les typhons. Sa précision permet de fournir des alertes plus précoces et plus fiables, contribuant à sauver des vies et à réduire les dégâts matériels.

La précision de GenCast a des implications majeures pour la planification des énergies renouvelables, notamment pour l’énergie éolienne. Des prévisions plus fiables renforcent la dépendance à l’énergie éolienne, favorisant son adoption à plus grande échelle comme ressource durable.

L’intégration de GenCast dans l’écosystème IA de Google

GenCast s’ajoute à la large gamme d’outils de prévision IA de Google, qui comprend déjà des modèles pour les précipitations, les inondations, les vagues de chaleur et les incendies. Ces outils sont intégrés dans des plateformes largement utilisées comme Google Recherche et Google Maps, rendant les prévisions avancées accessibles au grand public.

Google collabore activement avec des agences météorologiques, des météorologues et des chercheurs pour affiner et étendre les capacités de GenCast. En combinant méthodes traditionnelles de prévision et intelligence artificielle de pointe, ces partenariats visent à améliorer les prévisions météorologiques mondiales et à stimuler l’innovation.

Impact et développements futurs

Dans une démarche visant à favoriser l’adoption et l’innovation, Google a rendu GenCast accessible en open source, publiant son code et ses paramètres au public. L’entreprise prévoit également de fournir des prévisions en temps réel et des données historiques, permettant aux chercheurs et organisations d’intégrer GenCast dans leurs propres systèmes.

GenCast marque un tournant en météorologie, en combinant la puissance de calcul de l’IA à des décennies d’expertise météorologique. Alors que Google DeepMind continue d’affiner le modèle et de collaborer avec la communauté scientifique, les applications potentielles — de la réponse aux catastrophes à la planification énergétique en passant par les mises à jour météo quotidiennes — promettent un avenir plus prévisible et mieux préparé face aux défis climatiques mondiaux.

Pour les entreprises, chercheurs et gouvernements, GenCast établit une nouvelle norme en démontrant comment l’IA peut être un levier essentiel pour relever des défis complexes à l’échelle mondiale.

Lire plus

Intelligence Artificielle

ChatGPT : Quand l’IA refuse de parler de certains noms

par Yohann Poiron le 5 décembre 2024

L’une des principales promesses d’Internet est de fournir des réponses à presque toutes les questions, qu’elles concernent des sujets complexes ou des personnes spécifiques. Cependant, ChatGPT, l’un des chatbots les plus populaires au monde, semble se heurter à certaines limites.

Il existe des noms que l’intelligence artificielle refuse catégoriquement de mentionner ou de discuter, interrompant immédiatement la conversation. Cette situation intrigue les utilisateurs, d’autant plus qu’elle révèle des tensions entre la technologie, la vie privée et la réglementation.

Une liste noire de noms, dont l’énigmatique « David Mayer »

Sur des forums comme Reddit, une véritable enquête s’est formée autour des noms que ChatGPT évite systématiquement. Parmi eux, « David Mayer » a attiré une attention particulière. Pendant une longue période, toute tentative d’évoquer ce nom conduisait le chatbot à esquiver la question ou à interrompre la conversation. Cette situation a poussé les internautes à spéculer : Mayer serait-il une personnalité controversée ? Ou une simple victime d’un dysfonctionnement algorithmique ?

ChatGPT refuses to say the name “David Mayer,” and no one knows why.

If you try to get it to write the name, the chat immediately ends.

People have attempted all sorts of things—ciphers, riddles, tricks—and nothing works. pic.twitter.com/om6lJdMSTp

—Justine Moore (@venturetwins) November 30, 2024

Cependant, selon un rapport de CNET, la situation a évolué. Désormais, ChatGPT est capable de répondre aux questions sur David Mayer et de clarifier de qui il s’agit, suggérant que son inclusion dans cette « liste noire » n’était pas permanente.

Cette curiosité suscitée par les noms évités par l’IA a paradoxalement rendu ces derniers encore plus célèbres, puisque les utilisateurs peuvent facilement les chercher ailleurs sur Internet, mais pas via ChatGPT.

Le droit européen d’être oublié par les IA

L’une des potentielles raisons de l’existence de cette liste noire pourrait être liée à une législation européenne bien connue : le droit à l’oubli. Cette loi permet à toute personne de demander à des moteurs de recherche ou des plateformes numériques de ne pas afficher d’informations à leur sujet. Ce droit, conçu pour protéger la vie privée à l’ère numérique, s’étendrait également aux chatbots comme ChatGPT.

Dans une vidéo explicative, le journaliste technologique Bryan Lunduke évoque cette hypothèse, suggérant que certaines personnes auraient adressé des demandes à OpenAI pour empêcher la diffusion d’informations personnelles via ChatGPT. Bien qu’il ne soit pas confirmé que David Mayer ait utilisé ce droit, il illustre la manière dont la réglementation européenne peut influencer les réponses d’une IA.

Des sujets « interdits » pour les chatbots, pas que ChatGPT

Ce n’est pas seulement une liste de noms qui limite les capacités de ChatGPT. Depuis ses débuts, les IA ont été soigneusement encadrées pour éviter certains sujets sensibles. Des thèmes comme la religion, la race ou d’autres questions éthiques ont été exclus, soit pour éviter les biais, soit pour respecter les règles de modération.

En plus de ces sujets délicats, des limitations liées à la vie privée sont également en place. Certains individus ou contenus protégés par des lois ou des accords sont volontairement omis des réponses de l’IA.

Une IA en constante évolution, mais sous surveillance

L’intelligence artificielle a fait des progrès significatifs ces dernières années. ChatGPT, par exemple, est maintenant capable d’accéder à des informations en ligne grâce à des licences avec des éditeurs de contenu et à l’intégration de sources fiables. Cependant, son utilisation reste encadrée par des législations locales et des politiques de confidentialité strictes, qui limitent ce qu’il peut partager.

Cette évolution soulève des questions importantes sur l’équilibre entre la transparence des technologies et la protection des droits individuels. Tandis que des débats se poursuivent sur la manière de gérer ces restrictions, il est clair que l’IA, bien qu’incroyablement puissante, doit encore naviguer entre innovation et régulation.

Pour les utilisateurs, ces restrictions peuvent être frustrantes, mais elles reflètent aussi les complexités éthiques et légales d’un monde de plus en plus façonné par l’intelligence artificielle.

Lire plus

Intelligence Artificielle

Veo et Imagen 3 : Google domine l’IA générative vidéo et image

par Yohann Poiron le 5 décembre 2024

Alors que Amazon fait un grand pas dans l’espace de l’IA avec sa nouvelle famille de modèles de base Nova, Google redouble d’efforts pour développer ses propres capacités d’IA multimodale. Google a officiellement lancé Veo, son modèle d’IA générative vidéo, en aperçu privé via la plateforme Vertex AI. Ce lancement marque une étape clé, permettant aux entreprises d’intégrer ces outils révolutionnaires dans leurs processus de création de contenu.

Annoncé en mai 2024, Veo devance Sora, le modèle concurrent d’OpenAI, et positionne Google en tête dans la course à l’innovation vidéo générative.

Veo : Génération vidéo de haute qualité grâce à l’IA

Veo est capable de générer des vidéos en résolution 1080p avec des styles cinématographiques variés, à partir de simples prompts textuels ou visuels. Initialement annoncé pour produire des clips dépassant une minute, Google n’a pas précisé de limites pour cette version en aperçu, mais les exemples partagés montrent que les résultats sont quasi indiscernables des vidéos traditionnelles.

Avec des performances de cohérence au niveau des images, Veo est conçu pour répondre aux besoins des entreprises dans des domaines tels que la création de publicités dynamiques, la promotion de produits, et le storytelling immersif.

Imagen 3 élargit son accessibilité

En complément de Veo, Google déploie la dernière version de son générateur d’images Imagen 3 à tous les utilisateurs de Google Cloud, à partir de la semaine prochaine. Ce lancement étend la disponibilité initiale limitée sur AI Test Kitchen plus tôt cette année.

Les nouvelles fonctionnalités incluent :

Édition photo basée sur des prompts : Remplacement d’arrière-plan, inpainting, outpainting, et ajustements personnalisés.
Personnalisation de marque : Les utilisateurs peuvent intégrer des styles spécifiques, des logos ou des caractéristiques de produits directement dans les images générées.

Sécuriser l’utilisation responsable de l’IA

Pour répondre aux préoccupations liées à la désinformation, aux violations de droits d’auteur et aux usages abusifs, Veo et Imagen 3 intègrent la technologie de filigrane numérique SynthID de DeepMind. Ce système ajoute une signature invisible aux contenus générés, permettant de vérifier leur origine.

Cette fonctionnalité s’aligne sur les efforts de l’industrie, tels que le système Content Credentials d’Adobe, pour garantir la transparence des médias créés par l’IA. Selon Google, ces mesures visent à réduire les risques de désinformation et à promouvoir une utilisation responsable de l’IA.

Vertex AI : La plateforme au cœur de l’innovation

En intégrant Veo et Imagen 3 à Vertex AI, Google renforce sa position de leader dans le secteur des services d’IA. Ces outils permettent aux entreprises de :

Optimiser la production publicitaire : Créer des vidéos et images de qualité professionnelle rapidement et à moindre coût.
Accélérer le prototypage : Tester des idées créatives avec agilité.
Renforcer leur identité visuelle : Produire des contenus personnalisés adaptés à leurs besoins marketing spécifiques.

Avec Veo en aperçu privé et Imagen 3 accessible à grande échelle, Google redéfinit les workflows de création de contenu grâce à l’IA générative. Ces outils promettent de transformer la manière dont les entreprises produisent et diffusent leurs visuels, tout en accélérant l’innovation dans divers secteurs.

Alors qu’Amazon avance avec son propre modèle vidéo Nova Reel et qu’OpenAI prépare Sora, Google consolide son avance en proposant des outils prêts à être utilisés par les entreprises désireuses d’exploiter le plein potentiel de l’IA pour leur stratégie de contenu.

Lire plus

Intelligence Artificielle

GenFM : Transformez vos documents en podcasts avec l’IA !

par Yohann Poiron le 5 décembre 2024

Apprendre des sujets complexes devient plus simple et engageant grâce à GenFM, une nouvelle fonctionnalité révolutionnaire lancée par ElevenLabs dans son application Reader.

Cet outil permet de transformer vos documents, comme des PDF, articles ou livres numériques, en épisodes de podcasts animés par des co-animateurs virtuels d’IA qui discutent du contenu de manière dynamique et immersive.

Comment fonctionne GenFM ?

Analogue à NotebookLM de Google, GenFM utilise l’IA pour analyser les documents téléchargés et générer des podcasts synthétiques. Cependant, ElevenLabs va plus loin en créant des co-animateurs dont les voix et tons s’adaptent au sujet du document.

Ainsi, que vous téléchargiez une étude de cas commerciale, un essai philosophique ou un manuel technique, les voix des animateurs correspondent au contexte, rendant l’expérience encore plus captivante. Les dialogues générés par l’IA donnent l’impression d’écouter un véritable podcast conçu spécifiquement pour vos besoins.

Un atout pour les apprenants auditifs et les multitâches

Pour les apprenants auditifs ou ceux qui préfèrent assimiler des informations en multitâche—pendant un trajet, une séance de sport ou en cuisinant—GenFM est une solution idéale.

Au lieu d’écouter une lecture monotone d’un document, vous assistez à une conversation dynamique qui simplifie et explique les points clés. Cela ne rend pas seulement l’apprentissage plus accessible, mais également plus agréable.

GenFM pourrait s’avérer particulièrement utile pour les étudiants confrontés à des textes denses ou les professionnels cherchant à rester informés rapidement sur des tendances ou rapports sectoriels.

Les points forts : GenFM vs Google NotebookLM

Bien que GenFM et Google NotebookLM transforment tous deux des contenus écrits en discussions audio assistées par l’IA, GenFM se distingue par des avantages clés :

Support multilingue : GenFM prend en charge 32 langues, tandis que NotebookLM est limité à l’anglais pour l’instant.
Accessibilité élargie : GenFM est disponible sur plusieurs plateformes, alors que NotebookLM est uniquement accessible sur le Web.
Voix adaptées : GenFM ajuste les voix à la thématique du contenu, offrant une expérience audio plus immersive.

Ces fonctionnalités font de GenFM un outil polyvalent et inclusif pour un public mondial, notamment pour les non-anglophones ou ceux ayant des styles d’apprentissage variés.

Accessibilité et éthique

Outre ses avantages pour l’apprentissage, GenFM répond également aux défis d’accessibilité. Pour les personnes ayant des troubles visuels ou des difficultés de lecture, GenFM offre une manière engageante d’interagir avec du contenu via des discussions audio, plutôt qu’une simple narration monotone.

De plus, contrairement à certains outils d’IA en milieu académique qui soulèvent des préoccupations liées à la triche ou au plagiat, GenFM se positionne comme un outil éducatif éthique, destiné à enrichir la compréhension et non à contourner les efforts académiques.

L’avenir des podcasts générés par IA

À mesure que les outils d’IA continuent d’évoluer, des plateformes comme GenFM et NotebookLM redéfinissent l’expérience d’apprentissage. Que ce soit pour les étudiants, les professionnels ou les curieux, ces innovations ouvrent la voie à des expériences éducatives interactives et personnalisées.

Avec ElevenLabs à la tête de cette révolution, GenFM illustre le potentiel de l’IA à transformer la manière dont nous consommons et interagissons avec l’information.

GenFM n’est pas juste un outil, c’est une nouvelle façon d’apprendre. En transformant des textes statiques en contenus audio dynamiques, il répond à différents styles d’apprentissage, favorise l’accessibilité et démocratise le partage des connaissances. Que vous soyez étudiant, professionnel ou simplement curieux, GenFM est prêt à transformer votre liste de lecture en une playlist de podcasts personnalisés.

Lire plus

Intelligence Artificielle

ChatGPT : 300 millions d’utilisateurs et 1 milliard de messages par jour !

par Yohann Poiron le 5 décembre 2024

L’intelligence artificielle continue de séduire un nombre croissant d’utilisateurs. Lors du DealBook Summit du New York Times, Sam Altman, PDG d’OpenAI, a révélé que ChatGPT avait atteint 300 millions d’utilisateurs actifs chaque semaine. Cette annonce marque une croissance spectaculaire pour l’outil d’IA, qui comptait encore 100 millions d’utilisateurs en novembre 2023, avant de franchir le cap des 200 millions en août dernier.

En triplant sa base d’utilisateurs en l’espace d’un an, ChatGPT s’impose comme un acteur dominant dans le domaine de l’IA générative. Ce succès s’inscrit dans un contexte de forte concurrence face à des outils comme Grok d’X, Google Gemini, et le chatbot IA de Meta, intégré à Facebook et Instagram.

Altman a également révélé que la plateforme gère désormais plus d’un milliard de messages envoyés par jour. Cette croissance rapide s’explique notamment par les nouvelles fonctionnalités que OpenAI a régulièrement ajoutées pour enrichir l’expérience utilisateur comme un moteur de recherche intégré permettant d’afficher et de résumer des résultats issus du Web, bien que des inexactitudes puissent survenir, ou encore une interface « Canvas » qui facilite la modification et l’ajustement du code généré par le chatbot.

Durant son échange avec Andrew Ross Sorkin du New York Times, Altman a abordé des questions cruciales sur l’avenir de l’intelligence artificielle. Selon lui, l’arrivée de l’intelligence artificielle générale (AGI), capable d’exécuter des tâches au même niveau ou mieux que les humains, pourrait provoquer un choc sociétal plus intense que ce que beaucoup imaginent.

Il a également évoqué l’impact de l’IA sur l’économie des créateurs, affirmant qu’il faudra établir un « nouveau protocole » pour garantir que les créateurs soient correctement récompensés. « Nous avons besoin de nouveaux modèles économiques où les créateurs peuvent générer des revenus récurrents, » a-t-il ajouté.

Altman répond aux critiques de Musk

Altman n’a pas hésité à aborder les critiques répétées d’Elon Musk, qui a quitté le conseil d’administration d’OpenAI en 2018. Musk a souvent reproché à OpenAI d’avoir dévié de sa mission initiale d’open source, allant jusqu’à surnommer l’entreprise « ClosedAI » en mars dernier.

En septembre, Musk a critiqué la restructuration commerciale d’OpenAI, estimant qu’elle allait à l’encontre des lois encadrant les organisations à but non lucratif.

Altman a tenu à minimiser ces attaques, affirmant que Musk ne chercherait probablement pas à utiliser son influence politique pour nuire à OpenAI. « Il serait profondément anti-américain d’utiliser le pouvoir politique pour nuire à vos concurrents », a déclaré Altman. « Je ne pense pas que les gens toléreraient cela, et je ne pense pas qu’Elon le ferait ».

Un futur plein de défis et d’opportunités pour OpenAI et ChatGPT

Alors que ChatGPT franchit des jalons impressionnants, OpenAI se positionne comme un acteur incontournable dans le paysage de l’intelligence artificielle. Cependant, avec des concurrents de taille comme Google et Meta, et des débats en cours sur la réglementation et les modèles économiques, l’avenir de l’entreprise dépendra de sa capacité à innover tout en répondant aux préoccupations sociétales.

Lire plus

Intelligence Artificielle

ChatGPT : 1 milliard d’utilisateurs et la rentabilité en ligne de mire pour 2025 ?

par Yohann Poiron le 4 décembre 2024

En 2025, OpenAI ambitionne de franchir un cap ambitieux pour ChatGPT : atteindre 1 milliard d’utilisateurs et maximiser ses revenus. Alors que l’outil d’intelligence artificielle générative s’est imposé comme l’une des plateformes les plus visitées au monde, ses dirigeants cherchent à rivaliser avec des géants comme Instagram et TikTok, tout en consolidant sa position sur le marché.

ChatGPT a attiré environ 100 millions d’utilisateurs en seulement 2 mois après son lancement public, établissant un record en 2023. Aujourd’hui, la plateforme revendique 250 millions d’utilisateurs actifs chaque semaine, selon le Financial Times. Cependant, pour atteindre le milliard d’utilisateurs, OpenAI devra surmonter de nombreux défis, notamment celui de la rentabilité.

Alors que Instagram a atteint les 2 milliards d’utilisateurs mensuels en avril 2024 et que TikTok continue de dominer avec plus d’un milliard d’utilisateurs actifs mensuels dans le monde, OpenAI mise sur des investissements stratégiques pour élargir sa base d’utilisateurs.

ChatGPT, des coûts exorbitants et des projets d’expansion

Maintenir ChatGPT opérationnel est un véritable défi financier. En 2023, les coûts de fonctionnement de la plateforme étaient estimés à 700 000 dollars par jour, soit environ 36 centimes par requête. Ces dépenses n’ont fait qu’augmenter avec l’évolution des technologies et des services proposés par OpenAI.

En 2024, OpenAI devrait générer environ 3,7 milliards de dollars de chiffre d’affaires, principalement grâce à son abonnement ChatGPT Plus et à son API pour développeurs tiers. Cependant, les coûts d’exploitation et les salaires des employés pourraient atteindre 5 milliards de dollars, créant un déficit que l’entreprise doit combler.

Pour répondre à ces défis, OpenAI prévoit de construire de nouveaux centres de données aux États-Unis, notamment dans le Midwest et le sud-ouest, selon Chris Lehane, vice-président des affaires mondiales d’OpenAI. Ces projets, essentiels pour soutenir la croissance future de ChatGPT, ont même été évoqués lors de discussions avec la Maison-Blanche en raison des besoins énergétiques colossaux qu’ils impliquent.

Un modèle économique en mutation

Actuellement financé par ses abonnements payants et ses solutions API, OpenAI envisage de diversifier ses sources de revenus. L’ajout de publicités est une piste envisagée, bien qu’aucun plan concret ne soit encore en place. Sarah Friar, directrice financière d’OpenAI et ancienne responsable de la publicité chez Nextdoor et Salesforce, a déclaré que l’entreprise aborderait ce sujet de manière réfléchie : « Nous voulons être attentifs quant au moment et à l’endroit où nous implémentons des publicités ».

Cependant, intégrer des publicités pourrait s’avérer délicat pour une plateforme conçue initialement comme un outil de recherche et d’assistance.

Une levée de fonds record et des ambitions à long terme

En octobre dernier, OpenAI a levé 6,6 milliards de dollars, atteignant une valorisation impressionnante de 157 milliards de dollars. Ces fonds devraient permettre à l’entreprise de combler son déficit à court terme et de soutenir des projets de grande envergure, comme ses centres de données.

Par ailleurs, OpenAI semble prêt à transformer son modèle organisationnel. Après avoir opéré comme une organisation privée à but non lucratif, elle envisage une transition vers un modèle for-profit, plus adapté à ses ambitions de croissance.

Pour rester compétitif, OpenAI explore de nouveaux marchés, notamment dans les secteurs des moteurs de recherche et des navigateurs Web. L’entreprise aurait recruté plusieurs experts en publicité ayant travaillé chez Meta et Google, signalant une volonté d’intégrer des modèles publicitaires plus sophistiqués.

Avec des investissements massifs et une stratégie axée sur l’expansion, OpenAI espère faire de ChatGPT une plateforme incontournable en 2025. Reste à savoir si cette ambition sera suffisante pour surmonter les défis financiers et techniques liés à une croissance aussi rapide.

Lire plus

Intelligence Artificielle

AWS Bedrock : Distillation de modèles et vérifications logiques pour une IA plus performante

par Yohann Poiron le 4 décembre 2024

Lors de la conférence AWS re:Invent 2024, Amazon Web Services (AWS) a dévoilé des mises à jour majeures pour sa plateforme Bedrock, destinées à aider les entreprises à développer des modèles d’IA personnalisés et précis.

Parmi ces innovations, on trouve Amazon Bedrock Model Distillation, une méthode pour former des modèles plus compacts à partir de modèles volumineux, et Automated Reasoning Checks, un outil visant à réduire les erreurs factuelles dans les réponses générées par l’IA.

Amazon Bedrock Model Distillation : des modèles plus petits, mais plus intelligents

Avec Bedrock Model Distillation, AWS propose une méthode permettant de transférer les connaissances des modèles d’IA de grande taille, comme Llama 3.1 de Meta ou Claude d’Anthropic, vers des modèles plus petits et rapides, mieux adaptés aux charges de travail spécifiques des entreprises.

Pourquoi cette méthode est-elle cruciale ?

Modèles volumineux : Bien qu’ils soient riches en connaissances, ces modèles sont souvent trop lents et gourmands en ressources pour des cas d’usage nécessitant des réponses rapides.
Modèles compacts : Ces derniers offrent une vitesse accrue, mais leur capacité de traitement reste souvent limitée.

La distillation des modèles permet de conserver les avantages des modèles volumineux tout en profitant de la rapidité des modèles compacts. Voici comment cela fonctionne avec Bedrock :

Choix du modèle : Sélectionnez un modèle volumineux, comme un Llama 3.1 à 405 milliards de paramètres.
Modèle cible : Optez pour un modèle plus petit de la même famille.
Optimisation automatique : Utilisez des prompts pour transférer les connaissances et affiner les performances du modèle compact. Bedrock génère automatiquement des données supplémentaires pour améliorer cette distillation.

Actuellement, cette méthode est compatible avec les modèles de Meta, Anthropic et Amazon. AWS mise sur cette approche pour simplifier un processus souvent complexe et réservé aux experts en apprentissage automatique.

Automated Reasoning Checks : un bouclier contre les hallucinations IA

Même les modèles IA les plus précis peuvent générer des erreurs factuelles. Pour remédier à cela, AWS a introduit Automated Reasoning Checks, un outil intégré aux Guardrails Bedrock conçu pour valider la précision des réponses de manière logique et mathématique.

Fonctionnement :

Validation logique : L’outil vérifie si les réponses respectent les règles et les données fournies par l’utilisateur.
Création de règles sur mesure : Les entreprises peuvent importer leurs données, et Bedrock établit des règles spécifiques pour guider les réponses du modèle.
Correction des erreurs : Si une réponse générée est incorrecte, Automated Reasoning propose une solution alternative.

Matt Garman, PDG d’AWS, a souligné que cet outil renforce la fiabilité des modèles d’IA, les rendant adaptés à des domaines critiques comme le droit, la finance ou la santé.

Un équilibre entre rapidité et précision

Les entreprises recherchent de plus en plus des modèles capables de répondre rapidement tout en étant adaptés à leurs besoins spécifiques. Grâce à Model Distillation, elles peuvent former des modèles sur mesure, et avec Automated Reasoning Checks, elles s’assurent que ces modèles offrent des résultats fiables.

AWS ne fait pas ses premiers pas dans ce domaine. Depuis 2020, l’entreprise travaille sur des méthodes de distillation de modèles. Meta, Nvidia et d’autres acteurs ont également adopté ces techniques pour optimiser leurs modèles, comme le Llama 3.1-Minitron 4B de Nvidia, un modèle compact surpassant ses concurrents de taille similaire.

En intégrant ces capacités à Bedrock, AWS confirme son rôle de leader dans les solutions d’IA accessibles aux entreprises.

Les nouvelles fonctionnalités de Model Distillation et Automated Reasoning Checks témoignent de l’engagement d’AWS envers une IA responsable, centrée sur la précision et l’efficacité. Actuellement disponibles en aperçu, ces outils devraient s’enrichir avec les retours des premiers utilisateurs, consolidant ainsi la position d’AWS comme une référence dans le développement d’IA personnalisée pour les entreprises du monde entier.

Lire plus

Perplexity Comet devient enfin crédible sur iPad avec Split View et le multi-fenêtre

Apple signe un trimestre record, porté par l’iPhone 17 et les Services

Amazon transforme Wondery : le podcast devient une machine à commerce

John Ternus prépare l’ère IA d’Apple : moins de promesses, plus d’expériences utiles

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

Test Huawei MatePad 11.5 : La tablette PaperMatte, l’alliée idéale pour les étudiants et pros ?

Xiaomi 17T Pro : Dimensity 9500, 12 Go de RAM et batterie 7 000 mAh en fuite

Redmi K100 : prix en forte hausse, Snapdragon haut de gamme et lancement attendu

OnePlus Strix G15 : la manette qui transforme le OnePlus Ace 6 Ultra en console portable

Xiaomi 17 Max : le géant à batterie 8 000 mAh se préciserait pour mai

Malwarebytes arrive dans Claude pour détecter les arnaques sans quitter la conversation

OpenAI renforce la sécurité de ChatGPT avec des clés physiques YubiKey

Gemini génère désormais des fichiers Word, Excel et PDF téléchargeables

Android et IA : l’Europe veut forcer Google à ouvrir Gemini à la concurrence

Malwarebytes arrive dans Claude pour détecter les arnaques sans quitter la conversation

Notepad++ arrive sur macOS en version native gratuite, 23 ans après Windows !

Adieu Google Assistant : Gemini débarque dans votre voiture (et change tout)

DJI Osmo Pocket 4P : vidéo verticale, 4K 240 fps et zoom amélioré

Quels langages de programmation apprendre en 2026 ? Guide complet pour débutants

Google AI Studio augmente ses quotas pour les abonnés AI Pro et Ultra

Chronicle : OpenAI transforme Codex en assistant contextuel (et ça change tout)

OpenAI Codex : Pourquoi vous n’allez plus jamais quitter votre IDE ?

Claude Cowork : Le guide complet pour automatiser votre quotidien en 2026

Intel Core Ultra vs Apple Silicon : Quelle philosophie choisir pour votre prochain bureau compact ?

Comment arrêter le suivi des e-mails dans Gmail ?

Claude Code vs ChatGPT Codex : Quel agent choisir pour votre workflow en 2026 ?

Intelligence Artificielle

Malwarebytes arrive dans Claude pour détecter les arnaques sans quitter la conversation

OpenAI renforce la sécurité de ChatGPT avec des clés physiques YubiKey

Gemini génère désormais des fichiers Word, Excel et PDF téléchargeables

Android et IA : l’Europe veut forcer Google à ouvrir Gemini à la concurrence

IA et santé : pourquoi les chatbots restent peu fiables pour les décisions médicales

Gemini évolue : Google transforme son IA en assistant personnel avec mémoire et import de données