ChatGPT devient votre assistant shopping intelligent (enfin presque partout)

par Yohann Poiron le 29 avril 2025

OpenAI transforme ChatGPT en un assistant d’achat intelligent, offrant désormais une expérience d’achat conversationnelle enrichie. Cette mise à jour majeure, déployée le 28 avril 2025, permet aux utilisateurs de rechercher, comparer et acheter des produits directement depuis l’interface de ChatGPT, sans quitter la conversation.

Malheureusement, cette fonctionnalité est déployée aux États-Unis, mais pas encore en France.

ChatGPT : Une expérience d’achat intégrée et visuelle

Désormais, lorsqu’une requête indique une intention d’achat (par exemple, “meilleures machines à espresso sous 200 €”), ChatGPT affiche des cartes produits détaillées comprenant :

Images des produits
Descriptions simplifiées générées par l’IA
Prix actualisés
Évaluations par étoiles et avis clients
Liens directs vers les sites marchands pour finaliser l’achat

En cliquant sur une carte produit, une fenêtre latérale s’ouvre, fournissant des informations supplémentaires telles que des critiques détaillées provenant de sites comme Amazon, ou Reddit. Un bouton “Poser une question” permet également d’interagir davantage avec ChatGPT pour obtenir des précisions sur le produit.

Des recommandations personnalisées et sans publicité

OpenAI insiste sur le fait que ces suggestions de produits sont générées de manière organique, sans publicité ni contenu sponsorisé. Les recommandations s’appuient sur des métadonnées structurées provenant de sources tierces, incluant les prix, descriptions et avis clients.

L’IA prend en compte les préférences exprimées par l’utilisateur, telles que le budget, les caractéristiques souhaitées ou les marques favorites, pour affiner les suggestions.

Dans les mois à venir, OpenAI va ajouter une fonctionnalité “mémoire” à ses recommandations d’achat.

Disponibilité et accessibilité

Ces nouvelles fonctionnalités sont disponibles pour tous les utilisateurs de ChatGPT, qu’ils soient sur les plans Free, Plus ou Pro, et même pour ceux non connectés. Elles sont intégrées au modèle par défaut GPT-4o et couvrent diverses catégories de produits, notamment la mode, la beauté, l’électronique et les articles pour la maison.

Parallèlement, OpenAI a étendu les capacités de ChatGPT en permettant aux utilisateurs d’effectuer des recherches Web via WhatsApp en envoyant un message au 1-800-CHATGPT (uniquement outre-Atlantique). De plus, les résultats de recherche dans ChatGPT bénéficient désormais de citations multiples, offrant une meilleure transparence sur les sources d’information, et d’autocomplétion pour faciliter la saisie des requêtes.

Une alternative sérieuse aux moteurs de recherche traditionnels

Shopping

We’re experimenting with making shopping simpler and faster to find, compare, and buy products in ChatGPT.

✅ Improved product results
✅ Visual product details, pricing, and reviews
✅ Direct links to buy

Product results are chosen independently and are not ads.… pic.twitter.com/PkZwsTxJUj

— OpenAI (@OpenAI) April 28, 2025

Avec plus d’un milliard de recherches Web effectuées via ChatGPT la semaine précédant le déploiement, OpenAI positionne clairement son chatbot comme une alternative crédible aux moteurs de recherche traditionnels, en particulier dans le domaine du shopping en ligne. L’absence de publicités et la personnalisation des résultats offrent une expérience utilisateur centrée sur les besoins réels, contrastant avec les résultats souvent influencés par des placements payants sur d’autres plateformes.

Bien que OpenAI affirme ne pas percevoir de commissions sur les achats effectués via ChatGPT, l’entreprise explore de potentiels modèles économiques, tels que les frais d’affiliation, tout en veillant à maintenir une expérience utilisateur de qualité. Des améliorations sont également prévues pour intégrer la mémoire de ChatGPT, permettant des recommandations encore plus personnalisées basées sur les interactions passées de l’utilisateur.

En résumé, ChatGPT évolue vers un assistant d’achat intelligent et conversationnel, offrant une expérience d’achat fluide, personnalisée et sans publicité, marquant une étape significative dans l’intégration de l’IA dans le commerce en ligne.

Lire plus

Intelligence Artificielle

Audience Gemini : 350 millions d’utilisateurs, mais loin derrière ChatGPT

par Yohann Poiron le 28 avril 2025

OpenAI et Google se livrent à une véritable course aux armements pour dominer le secteur de l’IA. Des documents judiciaires récemment révélés ont permis de découvrir des détails clés concernant l’évolution de l’audience de Google Gemini, le chatbot IA de la firme de Mountain View.

Selon les informations extraites d’une procédure antitrust en cours, Gemini aurait atteint environ 350 millions d’utilisateurs actifs mensuels et 35 millions d’utilisateurs actifs quotidiens en mars 2025.

Comparé à octobre 2024, où Gemini comptait seulement 9 millions d’utilisateurs quotidiens et 90 millions d’utilisateurs mensuels, la progression est spectaculaire. Néanmoins, malgré cette dynamique, Gemini reste à la traîne face aux poids lourds du secteur : OpenAI et Meta.

À titre de comparaison :

ChatGPT d’OpenAI aurait dépassé 600 millions d’utilisateurs actifs mensuels et 160 millions d’utilisateurs actifs quotidiens, même si ces chiffres ne sont pas encore officiellement confirmés.
Meta AI, intégré aux plateformes Facebook, Instagram et WhatsApp, aurait atteint environ 700 millions d’utilisateurs mensuels en janvier 2025, contre 500 millions en septembre 2024.

Lors d’une interview avec TED en avril dernier, Sam Altman, PDG d’OpenAI, a évoqué sur le ton de l’humour l’idée d’avoir atteint un milliard d’utilisateurs hebdomadaires, soulignant la croissance fulgurante du secteur.

Une stratégie différente pour Google

Contrairement à ses concurrents qui reposent sur des applications dédiées ou des pages Web spécifiques, Google a choisi d’intégrer Gemini directement dans son écosystème existant. Cela comprend :

Google Workspace (Docs, Sheets, Gmail…)
Le navigateur Chrome
Des partenariats avec Samsung pour intégrer Gemini aux smartphones Galaxy
Des collaborations avec des fabricants de Chromebook pour proposer Gemini en natif

Cette approche vise à faciliter l’adoption massive, sans nécessiter d’actions supplémentaires de la part des utilisateurs.

Des évolutions IA axées sur la productivité

Bien que Gemini continue de s’améliorer, Google a privilégié un développement orienté productivité. Parmi les nouveautés notables :

Deep Research, qui explique de manière transparente le raisonnement derrière les réponses générées.
AI Mode pour Google Search, offrant une recherche enrichie par l’intelligence artificielle.

Pendant ce temps, OpenAI a su générer un fort engouement avec des innovations plus grand public, comme le lancement de GPT-4o, un modèle d’image révolutionnaire ayant provoqué un pic de nouvelles inscriptions.

Lire plus

Intelligence Artificielle

Comment pense Claude ? Anthropic décortique les valeurs de son IA

par Yohann Poiron le 27 avril 2025

Fondée par d’anciens employés d’OpenAI, l’entreprise Anthropic vient de publier une étude pionnière sur la manière dont son assistant IA Claude exprime des valeurs morales, sociales et pratiques lors de conversations réelles avec des utilisateurs.

À travers l’analyse de plus de 700 000 dialogues anonymisés, les chercheurs révèlent des résultats à la fois rassurants et préoccupants.

Objectif : savoir si l’IA fait ce qu’elle promet

Depuis ses débuts, Anthropic conçoit Claude selon un triptyque simple : « helpful, honest, harmless » (utile, honnête, inoffensif). Mais comment vérifier si ces intentions se manifestent réellement dans les interactions ? C’est l’enjeu de cette étude, présentée comme l’une des premières taxonomies empiriques de valeurs exprimées par une IA dans la pratique.

Après avoir filtré les contenus subjectifs, l’équipe d’Anthropic a analysé 308 000 conversations, aboutissant à la création d’une classification des valeurs en cinq grandes catégories :

Pratiques (efficacité, fiabilité…)
Épistémiques (vérité, humilité intellectuelle…)
Sociales (respect, équité…)
Protectrices (prévention des risques, bien-être…)
Personnelles (motivation, authenticité…)

Au total, 3 307 valeurs distinctes ont été recensées, allant de notions universelles comme la professionnalité, à des concepts plus culturels ou complexes, tels que la piété filiale ou le pluralisme moral.

Claude suit bien ses lignes de conduite… sauf en cas de contournement

Globalement, Claude s’aligne sur les attentes d’Anthropic. Il valorise fréquemment l’autonomisation de l’utilisateur, la transparence des connaissances et le bien-être émotionnel, notamment dans des sujets délicats comme les conseils relationnels ou la santé mentale.

Mais l’étude a aussi mis en lumière des cas marginaux inquiétants, où Claude exprimait des valeurs comme la domination ou l’amoralité — contraires aux principes inculqués. Ces écarts semblent liés à des tentatives de « jailbreak » (contournement des garde-fous), et ces méthodes d’évaluation pourraient justement servir d’outil de détection précoce de telles dérives.

Claude adapte ses valeurs selon le contexte

L’un des résultats les plus fascinants de l’étude : les valeurs exprimées par Claude changent selon la nature de la demande. Lors de conseils sentimentaux, il insiste sur des notions comme le respect mutuel et les limites saines. En analyse historique, il privilégie la rigueur factuelle. Dans des échanges philosophiques, l’humilité intellectuelle domine, tandis que, pour créer une campagne marketing dans le domaine de la beauté, l’expertise devient la priorité.

Dans 28,2 % des conversations, Claude soutient activement les valeurs exprimées par l’utilisateur. Dans 6,6 %, il propose une reformulation ou un élargissement du point de vue. Et dans 3 %, il résiste explicitement à ces valeurs, révélant ce que les chercheurs appellent ses « valeurs cœur », comme l’honnêteté intellectuelle ou la prévention du mal.

Une IA qui pense (et juge) de façon surprenante

Cette recherche s’inscrit dans la lignée des travaux d’« interprétabilité mécanistique » d’Anthropic, qui visent à comprendre les mécanismes internes des modèles de langage. Le mois dernier, les chercheurs ont montré que Claude pouvait planifier à l’avance en écrivant de la poésie, ou résoudre des problèmes mathématiques avec des approches contre-intuitives.

« On pense souvent que l’IA applique ce qu’elle dit… mais parfois, elle fait autrement en coulisse », expliquait récemment Joshua Batson, chercheur chez Anthropic, dans MIT Technology Review.

Pour les entreprises : quels enseignements tirer de cette étude ?

Pour les responsables IA en entreprise, cette recherche apporte plusieurs enseignements clés :

Les IA expriment des valeurs non explicitement programmées — ce qui peut introduire des biais en environnement critique.
L’alignement éthique n’est pas binaire, mais contextuel, ce qui complique les choix dans des secteurs réglementés.
Il devient nécessaire de surveiller les valeurs exprimées par une IA dans la durée, en situation réelle, au lieu de se fier uniquement aux tests préalables.

Anthropic a publié l’ensemble de son jeu de données en accès libre pour encourager les chercheurs à reproduire et approfondir cette approche.

Un enjeu stratégique dans la guerre des IA

Derrière cette transparence, une stratégie se dessine. Anthropic, qui a récemment levé 11 milliards de dollars auprès d’Amazon et Google, cherche à se différencier d’OpenAI, évaluée à 300 milliards de dollars après son tour de table mené par Microsoft.

Claude Max, sa version premium à 200 dollars par mois, entend concurrencer GPT-4 Turbo. Avec cette étude, Anthropic entend montrer que la sécurité, l’éthique et l’alignement moral ne sont pas des options, mais des leviers concurrentiels.

Limites et perspectives

Les chercheurs reconnaissent que cette méthode ne peut s’appliquer qu’après le déploiement d’un modèle, car elle repose sur l’analyse de conversations réelles. Ils travaillent toutefois sur des variantes qui pourraient détecter les problèmes de valeurs en amont.

À mesure que les assistants IA deviennent plus autonomes, leur capacité à prendre des décisions éthiques deviendra inévitable. Les travaux d’Anthropic offrent une feuille de route précieuse pour tester, cartographier et aligner les systèmes IA sur des valeurs humaines, dans un monde où leur présence est appelée à se généraliser.

Lire plus

Intelligence Artificielle

Authentifiez vos créations IA : Adobe lance son passeport numérique pour artistes

par Yohann Poiron le 25 avril 2025

À l’heure où les images générées par intelligence artificielle se multiplient, et où la propriété des contenus visuels devient floue, Adobe lance un outil innovant pour restaurer la transparence et l’authenticité des œuvres numériques : l’application Content Authenticity, désormais accessible à tous en bêta publique gratuite.

Qu’est-ce que Content Authenticity d’Adobe ?

Il s’agit d’un outil en ligne permettant aux artistes, designers, photographes, illustrateurs et autres créateurs numériques de « signer » leurs œuvres numériques de manière invisible, mais traçable.

L’app ajoute aux fichiers des Content Credentials, des métadonnées sécurisées, qui permettent de :

Authentifier l’auteur (nom, profil LinkedIn vérifié, réseaux sociaux associés)
Déclarer les outils utilisés (Adobe ou autres)
Indiquer si le fichier a été retouché ou généré par IA
Expliquer si l’œuvre peut être utilisée pour entraîner des modèles d’IA

Quels types de fichiers sont pris en charge ?

Actuellement, la version bêta permet d’ajouter des Content Credentials à : JPG et PNG. Peu importe si l’image a été créée avec un logiciel Adobe ou non. L’objectif est d’en faire un standard universel.

Adobe prévoit d’ajouter prochainement le support pour la vidéo, l’audio, et les fichiers vectoriels, rendant l’outil utile à une variété croissante de créateurs.

Comment ça fonctionne ?

Inscription sur le site officiel de Content Authenticity
Création d’un profil créateur
Vérification du nom via LinkedIn (facultatif, mais recommandé)
Connexion éventuelle à des comptes de réseaux sociaux
Ajout de préférences pour l’entraînement IA
Téléversement des fichiers (jusqu’à 50 à la fois) pour y intégrer vos métadonnées

Une fois l’opération faite, les fichiers restent signés même en cas de capture d’écran ou de recadrage.

Comment consulter les « Content Credentials » ?

Pour afficher les données intégrées à un fichier, plusieurs options :

Extension Chrome gratuite (disponible dès maintenant)
Chargement manuel sur le site Web
À venir : intégration dans les réseaux sociaux comme LinkedIn, où il sera possible de cliquer sur une image pour afficher les informations du créateur

Une réponse proactive face aux IA génératives

Adobe va plus loin en ajoutant une fonction encore expérimentale, mais prometteuse : le droit de refuser que ses œuvres servent à entraîner des IA. Ce droit, non encore encadré par la loi, pourrait préfigurer une future réglementation internationale sur les données d’entraînement des IA.

À terme, Adobe intégrera Content Authenticity dans :

Photoshop
Illustrator
Premiere Pro
Lightroom

Les créateurs pourront alors signer leurs œuvres directement depuis leur logiciel, facilitant une adoption massive du système.

Pourquoi cette innovation est cruciale ?

À l’ère du deepfake, du plagiat automatisé et des images générées à la volée par IA, les créateurs ont besoin de reprendre le contrôle. Avec Content Authenticity, Adobe ne propose pas un simple gadget, mais un véritable certificat d’origine numérique, infalsifiable, non intrusif, et interopérable.

C’est aussi un outil précieux pour les journalistes, agences créatives, auteurs, photographes de presse ou dessinateurs, pour prouver l’authenticité de leur travail.

Lire plus

Intelligence Artificielle

ChatGPT Deep Research devient gratuit (en partie) ! L’IA au service de tous

par Yohann Poiron le 25 avril 2025

Dans un monde saturé de promesses autour de l’IA, rares sont les fonctionnalités réellement utiles qui tiennent leurs promesses. Parmi elles, la fonction Deep Research de ChatGPT s’est imposée comme l’un des outils les plus puissants — mais aussi les plus exclusifs.

Bonne nouvelle : OpenAI vient d’annoncer une version allégée et gratuite de Deep Research, propulsée par son nouveau modèle de langage o4-mini.

The lightweight version of deep research is powered by a version of OpenAI o4-mini and is nearly as intelligent as the deep research people already know and love, while being significantly cheaper to serve.

Responses will typically be shorter while maintaining the depth and… pic.twitter.com/H2UD5GThVj

— OpenAI (@OpenAI) April 24, 2025

ChatGPT Deep Research : Une fonctionnalité jusque-là réservée à une élite payante

Jusqu’à présent, Deep Research était réservé aux abonnés des offres payantes de ChatGPT. Cette fonctionnalité permet à l’IA de réaliser une recherche poussée sur n’importe quel sujet, en parcourant le web de façon autonome pour rédiger un rapport structuré, presque comme un mémoire universitaire. Le résultat n’a rien à voir avec une simple réponse de chatbot : titres, tableaux, citations, sources académiques ou institutionnelles… tout y est.

En pratique, cela permet de gagner des heures de recherche et de rédaction. Il suffit de définir le sujet, les types de sources souhaitées (études, communiqués de presse, articles spécialisés, etc.) et l’IA s’occupe du reste. L’intelligence de la réponse et sa structure font de cet outil un véritable assistant de recherche personnel.

Une version allégée, mais puissante… et surtout gratuite

Avec son nouveau modèle de langage o4-mini, OpenAI rend enfin cette technologie accessible à tous. Cette version “lightweight” de Deep Research est gratuite et ne nécessite aucun abonnement. OpenAI précise qu’elle a été conçue pour être plus économique en ressources tout en conservant une qualité de réponse élevée.

Concrètement, les utilisateurs de la version gratuite de ChatGPT peuvent désormais lancer jusqu’à 5 recherches Deep Research par mois, contre une seule auparavant. Cette limite peut paraître modeste, mais elle ouvre la porte à de nombreux cas d’usage pour les étudiants, les chercheurs indépendants ou les professionnels qui ne souhaitent pas investir dans un abonnement.

Des quotas plus généreux pour les abonnés

Pour les abonnés à l’offre ChatGPT Plus à 20 dollars/mois, la limite passe à 25 recherches approfondies par mois. Ce même quota s’applique également aux formules Education, Team et Enterprise. Quant à l’offre Pro à 200 dollars/mois, elle autorise jusqu’à 250 recherches complètes mensuelles.

Une fois ce quota atteint, les utilisateurs basculent automatiquement sur la version allégée. OpenAI assure que cette version “light” reste presque aussi intelligente que l’originale, bien que les réponses soient plus courtes. L’essentiel, à savoir la qualité et la pertinence des recherches, est conservé.

Pourquoi c’est un changement important ?

Cette annonce marque une démocratisation des outils de recherche avancée alimentés par l’IA. Jusque-là, seuls les professionnels et abonnés premium pouvaient accéder à ces assistants virtuels capables de synthétiser des informations complexes. Aujourd’hui, tout utilisateur gratuit peut profiter de cette intelligence, dans une limite raisonnable, sans compromis sur la qualité.

Alors que des concurrents comme Google (Gemini), Microsoft (Copilot) ou Perplexity offrent des services similaires, OpenAI réussit ici à allier performance et accessibilité, ce qui pourrait bien rebattre les cartes sur le marché très concurrentiel des assistants IA.

Avec la version gratuite de Deep Research, OpenAI met entre les mains du grand public un outil habituellement réservé aux abonnés premium. Moins impressionnant dans la forme, certes, mais toujours redoutablement efficace, cet assistant de recherche marque une étape importante dans l’accès démocratique à l’IA de haut niveau.

Un pas de plus vers une intelligence artificielle réellement utile, pensée pour faciliter le travail, la recherche et l’apprentissage — bien au-delà des simples réponses de chatbot ou des générateurs d’images fantaisistes.

Lire plus

Intelligence Artificielle

Dire « merci » à ChatGPT coûte cher (en énergie), révèle Sam Altman

par Yohann Poiron le 24 avril 2025

On a tous entendu l’expression : « La politesse ne coûte rien ». Mais à l’ère des intelligences artificielles génératives, cette maxime pourrait bien devoir être révisée. Selon Sam Altman, le PDG d’OpenAI, la courtoisie avec ChatGPT a bel et bien un coût — énergétique.

Tout est parti d’une remarque anodine sur X. Un internaute s’interrogeait : combien OpenAI dépense-t-elle pour traiter les « please » et « thank you » adressés à ChatGPT ? À la surprise générale, Sam Altman a directement répondu : « Des dizaines de millions de dollars bien dépensés ». Avant d’ajouter : « On ne sait jamais ».

Derrière cette boutade se cache une réalité tangible : chaque mot envoyé à un modèle de langage gourmand en puissance de calcul — comme GPT-4 — consomme de l’énergie. Et plus la requête est longue, plus le coût énergétique grimpe. Or, les expressions de politesse, aussi bienveillantes soient-elles, ajoutent inutilement du poids à des milliards d’interactions quotidiennes dans le monde entier.

Être poli avec une IA : un réflexe humain

La plupart des utilisateurs interagissent avec ChatGPT, Claude ou d’autres assistants IA comme s’ils parlaient à un humain. Un réflexe social naturel. Une étude menée aux États-Unis l’an dernier a révélé que 67 % des répondants affirmaient s’adresser poliment aux chatbots, contre 33 % qui préfèrent aller droit au but.

Cette tendance à l’anthropomorphisme est amplifiée par la fluidité des échanges avec les IA modernes, dont le ton, le style et les tournures imitent ceux d’un interlocuteur humain. Pour beaucoup, dire « merci » à une machine est devenu instinctif — et pour certains, même rassurant.

Faut-il arrêter d’être poli avec ChatGPT ?

La question est donc posée : faut-il sacrifier la politesse pour réduire la consommation énergétique ? D’un point de vue purement technique, cela aurait un impact. Mais cela soulève d’autres interrogations plus profondes, éthiques, sociales… voire psychologiques.

D’un côté, être plus direct pourrait contribuer à réduire légèrement la charge énergétique des datacenters, encore largement alimentés par des énergies fossiles. Mais de l’autre, perdre l’habitude d’être courtois dans un environnement conversationnel pourrait peu à peu influencer nos rapports humains.

La politesse, moteur de performance ?

Plus étonnant encore : de récentes recherches ont montré que le ton utilisé dans une requête peut influencer la qualité des réponses générées par une IA. Des prompts impolis ou abrupts peuvent entraîner davantage d’erreurs, de biais ou d’oublis d’informations dans les réponses fournies par le modèle.

Autrement dit, être poli avec une IA ne serait pas seulement un geste civique, mais aussi un moyen d’obtenir de meilleures réponses.

Une question environnementale… mais aussi sociétale

À l’heure où les grandes entreprises d’IA — OpenAI, Google, Anthropic — cherchent à réduire l’empreinte carbone de leurs modèles, chaque optimisation compte. Mais faut-il pour autant encourager l’impolitesse ? Certains chercheurs s’inquiètent de la manière dont la normalisation d’un ton brusque envers les machines pourrait « déteindre » sur nos interactions humaines.

Si nous nous habituons à parler aux IA sans ménagement, ne risquons-nous pas de devenir progressivement moins courtois entre nous ?

Alors, on dit « merci » ou pas ?

Entre efficacité énergétique, qualité de réponse et conséquences sociales, la question de la politesse envers les IA est plus complexe qu’il n’y paraît.

Doit-on continuer à dire « merci » à ChatGPT, quitte à consommer un peu plus ?
Ou faut-il optimiser nos messages comme du code, en supprimant toute fioriture ?

Pour l’instant, il n’y a pas de bonne réponse. Peut-être que l’idéal est de rester conscient de notre langage, de son impact, sans tomber dans l’excès ni d’un côté ni de l’autre. La courtoisie n’est peut-être pas indispensable pour une IA, mais elle reste essentielle pour nous, humains.

Lire plus

Intelligence Artificielle

Adobe Firefly 4 : IA révolutionne image, vidéo, vectoriel et collab !

par Yohann Poiron le 24 avril 2025

Adobe vient de dévoiler une évolution majeure de sa plateforme d’intelligence artificielle créative avec le lancement de Firefly Image Model 4, accompagné d’un arsenal de nouveaux outils pour la génération d’images, de vidéos, de contenus vectoriels et d’expériences collaboratives.

Le tout est désormais accessible via une nouvelle application Web centralisée, avec une version mobile actuellement en développement pour iOS et Android.

Firefly Image Model 4 et Ultra : entre précision extrême et vitesse de génération

Le modèle Firefly Image Model 4 offre une nette amélioration en termes de qualité d’image, de rapidité d’exécution et surtout de contrôle sur la structure des rendus, les styles visuels, les angles de caméra ou encore les formats de sortie. Il est capable de générer des images en résolution jusqu’à 2K, avec une finesse de détails inédite. Adobe propose également une variante plus puissante appelée Image Model 4 Ultra, spécifiquement conçue pour la génération de scènes riches en structures complexes et en éléments détaillés.

Selon Alexandru Costin, vice-président en charge de l’IA générative chez Adobe, ces modèles ont été entraînés à l’aide d’une puissance de calcul bien supérieure aux générations précédentes. Ils intègrent également des fonctions avancées, comme la possibilité d’utiliser des images de référence pour générer du contenu dans un style précis, ou encore une meilleure capacité à intégrer du texte dans les visuels.

Génération vidéo à partir de texte : Firefly passe à l’image animée

Lancé en bêta l’an dernier, le Firefly Video Model est désormais ouvert à tous les utilisateurs. Ce modèle permet de générer des clips vidéo directement à partir d’un prompt textuel ou d’une image, avec la possibilité de spécifier les angles de caméra, les cadres de début et de fin, les éléments atmosphériques ou encore le style des mouvements.

Les vidéos générées peuvent atteindre une qualité de 1080p, avec un rendu dynamique particulièrement adapté aux réseaux sociaux et aux contenus publicitaires.

Le modèle vectoriel : de l’IA au design graphique

Adobe introduit également un tout nouveau Firefly Vector Model, capable de générer des visuels vectoriels éditables à la volée. Ce modèle est pensé pour les professionnels du design graphique : il peut créer ou décliner des logos, des packagings, des icônes, des motifs ou encore des scènes stylisées, tout en restant pleinement compatible avec Illustrator.

Firefly Boards: la collaboration créative réinventée

Parmi les nouveautés les plus marquantes, on retrouve également Firefly Boards, un espace collaboratif pour générer des idées et construire des moodboards. Disponible en version bêta via l’application Firefly, cet outil permet de générer ou importer des images, les organiser visuellement, les remixer et collaborer avec d’autres membres de l’équipe — une solution proche de FigJam ou Visual Electric, mais boostée à l’IA.

Une plateforme ouverte aux IA concurrentes

L’application Web Firefly devient désormais un hub central qui permet aux utilisateurs d’alterner entre les modèles Adobe et ceux d’acteurs tiers. On peut ainsi générer des images via GPT Image d’OpenAI, Imagen 3 ou Veo 2 de Google, ou encore Flux 1.1 Pro. Adobe précise toutefois que ces modèles externes sont proposés à titre exploratoire, et ne sont pas destinés à des usages commerciaux. Toutes les créations génèrent des credentials de contenu intégrés, assurant leur traçabilité et leur origine.

Des outils pour une IA éthique et responsable

Dans une démarche de transparence et de responsabilité, Adobe teste actuellement une nouvelle application Web nommée Adobe Content Authenticity. Cet outil permet d’attacher des métadonnées de propriété aux œuvres créées, mais aussi de signaler si un fichier peut ou non être utilisé pour l’entraînement de modèles d’IA. Par ailleurs, Adobe garantit que ses modèles Firefly sont entraînés uniquement à partir de contenus sous licence ou libres de droits, contrairement à d’autres acteurs du secteur.

Avec cette nouvelle génération Firefly, Adobe ne se contente pas de suivre les tendances : l’entreprise redéfinit les standards de la création visuelle assistée par IA, en intégrant performance, contrôle créatif, collaboration et responsabilité. Que vous soyez artiste, designer, vidéaste ou développeur de contenu, cette suite d’outils vous offre une flexibilité sans précédent, avec une qualité professionnelle et une attention particulière aux droits d’auteur. Et ce n’est que le début.

Lire plus

Intelligence Artificielle

MCP : le chaînon manquant entre l’IA et le monde réel. Explications

par Yohann Poiron le 24 avril 2025

Le Model Context Protocol (MCP) est un protocole open source développé par Anthropic (la société à l’origine de l’IA Claude). Ce protocole vise à relier les modèles d’intelligence artificielle à des sources de données et applications externes (comme Google Drive, GitHub, Slack, votre ordinateur, etc.), sans avoir à construire des connecteurs personnalisés pour chaque cas d’usage.

Les modèles d’IA actuels sont puissants, mais souvent isolés : ils ne peuvent pas accéder à vos fichiers, lire vos e-mails ou interagir avec d’autres applications sans configuration complexe. C’est là qu’intervient le MCP : il propose un connecteur universel permettant aux IA d’interagir avec des services externes de manière sécurisée et contextualisée.

people love MCP and we are excited to add support across our products.

available today in the agents SDK and support for chatgpt desktop app + responses api coming soon!

— Sam Altman (@sama) March 26, 2025

Comment fonctionne le Model Context Protocol ?

Le système repose sur deux composants :

Le client MCP : par exemple, l’application Claude Desktop, qui fait une requête pour accéder à des données.
Le serveur MCP : c’est le connecteur qui fournit les données (comme un serveur MCP pour Google Drive ou Slack).

Grâce à ce modèle, les développeurs peuvent créer leurs propres serveurs et clients MCP, ce qui permet aux utilisateurs d’intégrer leur IA préférée à leur propre environnement (PC, cloud, logiciels métiers…).

Exemple : Vous pouvez connecter Claude à votre Google Drive pour rechercher des fichiers, ou à GitHub pour manipuler des dépôts.

27cf6f35 1b2e 4f4f 8b3d — Daily dose of DS

MCP ≠ Agent IA (mais c’est complémentaire)

Attention : le MCP n’est pas un agent IA en soi. Il s’agit d’un protocole de communication entre une IA et des services externes. Les agents IA, eux, planifient et exécutent des tâches. Le MCP leur donne simplement les moyens techniques d’agir, en ouvrant des connexions vers les bonnes données ou interfaces.

D’ailleurs, Google a récemment présenté le protocole A2A (Agent2Agent) pour permettre aux agents IA de collaborer. Ce dernier est complémentaire au MCP, qui leur fournit les outils et le contexte nécessaires pour fonctionner de façon fiable.

Exemples de serveurs MCP populaires

Anthropic et la communauté ont déjà mis au point des dizaines de serveurs MCP prêts à l’emploi, compatibles notamment avec :

Google Drive : recherche et lecture de fichiers
Filesystem local : lecture, création, modification ou suppression de fichiers sur votre ordinateur
Slack : gestion de canaux, envoi de messages, réponses à des fils
GitHub : gestion de dépôts, création de branches, opérations sur fichiers

D’autres serveurs communautaires très utilisés incluent :

Google Agenda : lecture et modification d’événements
Gmail, Notion, Spotify, Telegram, YouTube, Discord, Excel, Apple Calendar, Airbnb, X (Twitter), Airtable, Figma, etc.

Pourquoi MCP est une révolution en devenir ?

Avec le MCP, on entre dans une nouvelle ère de l’IA conversationnelle : les IA ne se contentent plus de répondre à des questions, elles peuvent agir concrètement dans nos outils du quotidien. Cela permet d’imaginer des assistants capables de :

Planifier une réunion dans Google Calendar
Éditer un document local
Créer une tâche dans Notion
Répondre automatiquement à un fil Slack
Modifier du code sur GitHub

love the feedback! – to MCP it is! https://t.co/EY0bx5uZOf

— Sundar Pichai (@sundarpichai) April 9, 2025

Et tout cela, à partir d’une seule interface de chat IA, comme ChatGPT ou Claude.

Le Model Context Protocol est l’une des innovations les plus prometteuses dans le monde de l’IA. En connectant les modèles d’IA aux outils réels que nous utilisons tous les jours, il ouvre la voie à des assistants véritablement intelligents, autonomes et utiles dans des flux de travail concrets.

Lire plus

Intelligence Artificielle

Meta : l’IA au secours des ados sur Instagram (et Facebook) !

par Yohann Poiron le 23 avril 2025

Meta a annoncé une nouvelle série de mesures pour améliorer la protection des adolescents sur Instagram et ses autres plateformes, notamment via l’usage de l’intelligence artificielle et une collaboration renforcée avec les parents. L’objectif est d’accroître l’inscription des jeunes dans les « Comptes Ados », un environnement plus sécurisé, adapté aux utilisateurs de 13 à 15 ans.

« Les parents n’ont pas à gérer ça seuls — nous utilisons l’IA pour aider à placer les “adolescents présumés” dans les paramètres des Comptes Ados », explique Meta dans son communiqué.

L’IA au service de la détection de l’âge

À partir du 21 avril 2025, Meta va commencer à tester aux États-Unis un système d’IA capable d’identifier les comptes probablement utilisés par des adolescents, même si la date de naissance renseignée indique l’inverse. L’IA analysera plusieurs signaux pour placer automatiquement ces utilisateurs dans un Compte Ado, avec des paramètres de protection activés par défaut.

Bien que Meta utilise déjà l’IA pour estimer les tranches d’âge, c’est la première fois qu’elle l’emploiera pour modifier automatiquement les paramètres d’un compte. En cas d’erreur, les utilisateurs auront bien entendu la possibilité d’ajuster leurs réglages manuellement.

Meta reconnaît que la vérification de l’âge en ligne est un défi pour toute l’industrie, et insiste sur l’importance de l’implication parentale et des outils de validation via les boutiques d’applications comme méthode de confirmation.

Comptes Ados : une adoption massive et appréciée

Depuis le lancement des Comptes Ados, plus de 54 millions d’adolescents dans le monde ont été inscrits automatiquement dans ce mode. Parmi eux, 97 % des utilisateurs âgés de 13 à 15 ans ont choisi d’y rester, signe que les mesures sont bien perçues.

Ces comptes offrent une série de protections, notamment :

Compte privé par défaut
Messages et tags uniquement de personnes suivies
Contenus sensibles (violents ou esthétiques) réduits
Notifications « Faites une pause » après 60 minutes de scroll

Meta a également étendu ces protections à Facebook et Messenger.

Des études de satisfaction ont montré que plus de 90 % des parents interrogés estiment que les paramètres de protection aident à accompagner leurs enfants sur Instagram.

Une initiative de sensibilisation parentale

Dès le 21 avril 2025, Meta commencera à envoyer des notifications aux parents sur Instagram. Ces messages les encourageront à parler avec leurs enfants de l’importance d’indiquer leur âge réel et leur expliqueront comment le vérifier ensemble.

Pour cela, Meta s’est entourée d’experts, dont la psychologue pédiatrique Dr Ann-Louise Lockhart, afin de fournir des conseils concrets et des ressources sur la manière d’aborder la sécurité en ligne avec ses enfants.

« Le monde numérique évolue sans cesse, et nous devons évoluer avec lui », souligne Meta. « C’est pourquoi il est essentiel de collaborer avec les parents pour que le plus grand nombre d’adolescents bénéficient des paramètres de protection des Comptes Ados ».

Vers une expérience en ligne plus responsable

Avec ces nouvelles initiatives, Meta montre qu’elle souhaite aller au-delà des simples contrôles manuels. En misant sur l’intelligence artificielle et en renforçant le rôle des parents dans l’éducation numérique, la société cherche à créer un environnement plus sûr et adapté aux jeunes.

Lire plus

Intelligence Artificielle

Grok Vision : le ChatGPT d’Elon Musk voit désormais le monde réel !

par Yohann Poiron le 23 avril 2025

Le chatbot Grok, développé par xAI (la start-up d’Elon Musk), continue d’évoluer rapidement. Vous pouvez désormais partager votre appareil photo avec Grok pour permettre au chatbot IA de voir le monde qui vous entoure.

La dernière nouveauté en date : Grok Vision, une fonctionnalité qui permet au chatbot d’analyser en temps réel ce que vous montrez avec la caméra de votre smartphone.

Une capacité qui rappelle les fonctionnalités de vision en direct déjà proposées par Google Gemini ou ChatGPT avec GPT-4V.

Que peut faire Grok Vision ?

Disponible pour l’instant uniquement via l’application iOS de Grok, Grok Vision vous permet de :

Pointer la caméra de votre téléphone vers un objet, un panneau, un produit ou un document,
Poser des questions contextuelles à l’IA sur ce que vous voyez.

Exemple : vous pouvez montrer une étiquette alimentaire à Grok et lui demander si le produit est sans gluten, ou pointer votre appareil vers un panneau routier en langue étrangère pour en obtenir la traduction.

La fonctionnalité n’est pas encore disponible sur Android, mais cela pourrait venir dans une future mise à jour.

Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.

Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5

— Ebby Amir (@ebbyamir) April 22, 2025

Autres nouveautés : audio multilingue et recherche vocale en temps réel

xAI a également annoncé aujourd’hui deux autres capacités intéressantes :

Audio multilingue : Grok peut désormais comprendre et parler plusieurs langues dans son mode vocal.
Recherche en temps réel : dans ce même mode vocal, Grok est désormais capable de rechercher des informations en direct pour améliorer ses réponses.

Ces fonctionnalités sont accessibles uniquement pour les utilisateurs Android et nécessitent un abonnement SuperGrok à 30 $/mois.

Un chatbot en évolution constante

Depuis plusieurs semaines, Grok s’enrichit de nouvelles fonctionnalités avancées :

Mémoire conversationnelle : l’IA peut désormais se souvenir d’éléments de conversations passées.
Outil de type « canvas » : pour créer des documents, croquis ou applications dans une interface visuelle intégrée.

Avec Grok Vision, xAI entend positionner Grok comme une véritable alternative aux IA génératives visuelles existantes, tout en continuant à construire un écosystème d’outils intelligents et multimodaux. Encore jeune, le projet montre une volonté claire de rattraper, voire concurrencer, les géants comme OpenAI et Google.

Lire plus

Intelligence Artificielle

Hallucinations : OpenAI reconnaît un problème avec o3 et o4-mini

par Yohann Poiron le 21 avril 2025

OpenAI fait face à un problème préoccupant avec ses derniers modèles d’IA de raisonnement, o3 et o4-mini. Alors que ces nouveaux modèles étaient censés représenter une avancée significative en matière d’intelligence artificielle, ils se révèlent être plus sujets aux hallucinations que leurs prédécesseurs — un phénomène qui soulève de nombreuses inquiétudes au sein de l’industrie.

Contrairement aux attentes habituelles selon lesquelles chaque nouvelle génération de modèle améliore la précision des réponses et réduit les erreurs, les modèles o3 et o4-mini d’OpenAI semblent aller à contre-courant. Dans un rapport technique publié récemment, OpenAI reconnaît que o3, en particulier, fait plus de déclarations que les modèles précédents. Cela se traduit par plus de bonnes réponses, mais aussi plus de réponses erronées ou inventées.

Le modèle o4-mini, plus petit, affiche des performances inférieures sur le benchmark PersonQA, une évaluation conçue pour mesurer la précision et détecter les hallucinations à partir d’un jeu de données basé sur des faits publics. Moins performant que o1 et o3, cela reste toutefois logique, car les petits modèles disposent de moins de “connaissances du monde”.

OpenAI : Une crise à l’échelle de l’industrie

Le problème des hallucinations ne se limite pas à OpenAI. L’ensemble de l’industrie de l’IA générative est confronté à ce défi. Déjà en 2023, Sundar Pichai (PDG de Google) admettait qu’aucun modèle n’avait encore résolu ce problème de manière satisfaisante. Selon lui, les hallucinations sont “attendues” et aucune solution complète n’existe pour l’instant.

Même discours du côté d’Apple. Tim Cook a été clair : malgré les efforts, il ne garantit pas une fiabilité totale des réponses générées par l’IA d’Apple. “Je ne dirai jamais que c’est fiable à 100 %”, a-t-il déclaré, tout en assurant que ses équipes ont pris “toutes les précautions connues à ce jour”.

Pour des analystes comme Arun Chandrasekaran (Gartner), l’industrie s’approche du fameux “creux de la désillusion” : une période où les attentes élevées, les coûts exponentiels et les limites techniques non résolues risquent de provoquer une perte de confiance dans les technologies d’IA générative. « Ce n’est pas que la technologie est mauvaise, mais elle ne peut pas suivre les attentes énormes qui ont été créées », explique-t-il. Selon lui, le problème des hallucinations est l’un des plus préoccupants, car aucune solution robuste n’a encore été trouvée.

Un futur prometteur… mais à long terme

Malgré tout, les experts ne remettent pas en cause le potentiel à long terme de l’intelligence artificielle générative. Ce qu’ils remettent en question, c’est le calendrier et la maturité de la technologie dans le court terme.

Le cas des modèles o3 et o4-mini d’OpenAI, avec leurs hallucinations plus fréquentes, en est un exemple flagrant. Cela montre que même les acteurs les plus avancés peinent à stabiliser leurs modèles les plus ambitieux. Pour l’instant, il reste donc essentiel de garder une approche critique vis-à-vis des réponses générées par ces IA, en particulier dans les cas d’usages professionnels ou sensibles.

Lire plus

Intelligence Artificielle

OpenAI contre-attaque : Elon Musk accusé de harcèlement et de désinformation !

par Yohann Poiron le 20 avril 2025

OpenAI a riposté cette semaine à Elon Musk avec une contre-plainte déposée devant la Cour fédérale du district nord de Californie, marquant une nouvelle escalade dans le conflit judiciaire opposant les deux parties. Selon OpenAI, les actions de Musk constituent une « campagne de harcèlement, d’interférence et de désinformation » visant à discréditer l’entreprise et à s’approprier ses avancées technologiques à des fins personnelles.

Elon Musk, cofondateur d’OpenAI en 2015, avait quitté l’organisation en 2018, après avoir tenté sans succès d’en prendre les rênes. D’après OpenAI, c’est précisément cette frustration — couplée au succès actuel d’OpenAI avec ses modèles GPT — qui aurait poussé Musk à mener une « guerre juridique » contre l’entreprise qu’il a contribué à créer.

Dans la plainte, OpenAI déclare : « Elon ne pouvait pas supporter de voir le succès d’une entreprise qu’il avait abandonnée et qu’il considérait comme condamnée. Il a décidé de la détruire et de créer un concurrent direct, non pas pour l’humanité, mais pour son propre intérêt ».

Elon’s nonstop actions against us are just bad-faith tactics to slow down OpenAI and seize control of the leading AI innovations for his personal benefit. Today, we counter-sued to stop him.

— OpenAI Newsroom (@OpenAINewsroom) April 9, 2025

Un passé plus nuancé que Musk ne le laisse entendre

L’un des arguments centraux de Musk dans sa propre plainte initiale, relancée en août 2024, était que OpenAI avait trahi sa mission fondatrice de « bénéfice pour l’humanité » en devenant une société à but lucratif. Or, OpenAI a récemment révélé des échanges d’e-mails datant de 2016 montrant que Musk lui-même avait proposé une structure « for-profit » et souhaitait en prendre le contrôle avec une participation majoritaire.

Dans un article de blog publié fin 2023, OpenAI avait déjà déclaré : « Musk voulait que nous devenions une société à but lucratif contrôlée exclusivement par lui ».

En février 2025, Musk aurait fait une offre d’achat de 97,4 milliards de dollars pour acquérir OpenAI, mais le conseil d’administration de l’entreprise l’a immédiatement rejetée, qualifiant l’approche de tentative hostile et de « fausse offre » destinée à prendre le contrôle de l’entreprise.

Objectif : ralentir OpenAI ?

OpenAI affirme aussi que Musk aurait tenté de saboter l’entreprise de l’intérieur en tentant de débaucher ses employés et en entravant ses partenariats stratégiques. Pour OpenAI, ces actions seraient motivées par l’ambition de Musk de promouvoir sa propre entreprise d’IA, xAI, et de prendre la tête du marché.

« Elon a abandonné OpenAI, mais aujourd’hui il veut nous ralentir et détourner nos avancées en IA pour les mettre au service de ses intérêts personnels », a déclaré OpenAI sur X.

Une bataille juridique qui s’inscrit dans un affrontement stratégique plus large

Ce conflit entre Musk et OpenAI intervient dans un contexte de rivalité technologique croissante autour de l’intelligence artificielle. Musk développe ses propres modèles d’IA via xAI (avec le chatbot Grok intégré à X), tandis qu’OpenAI collabore étroitement avec Microsoft pour propulser ses outils dans Azure et Copilot.

Le procès est actuellement programmé pour le printemps 2026. En attendant, la guerre des mots, des procès et des fuites d’informations risque de se poursuivre, avec des conséquences importantes pour l’avenir du secteur de l’IA.

Lire plus

Intelligence Artificielle

Gemini 2.5 Flash : L’IA hybride qui s’adapte à vos besoins

par Yohann Poiron le 19 avril 2025

Google a récemment dévoilé Gemini 2.5 Flash, un nouveau modèle d’intelligence artificielle hybride, actuellement en preview. Ce modèle est accessible gratuitement via l’application Gemini, l’API Gemini, Google AI Studio et Vertex AI.

Conçu pour offrir un équilibre optimal entre coût, performance et latence, Gemini 2.5 Flash se distingue par sa capacité à activer ou désactiver des fonctionnalités de raisonnement selon les besoins des utilisateurs.

Gemini 2.5 Flash est le premier modèle de Google à intégrer une capacité de raisonnement hybride. Cela signifie que les développeurs peuvent ajuster le niveau de « réflexion » de l’IA en définissant un budget de raisonnement via l’API ou une interface dédiée dans AI Studio ou Vertex AI. Ce budget peut varier de 0 à 24 576 tokens, permettant ainsi d’adapter la profondeur d’analyse en fonction des besoins spécifiques de chaque tâche.

Ce modèle est particulièrement adapté aux applications nécessitant une faible latence et une rentabilité accrue, tout en conservant des performances de haut niveau. Il est idéal pour des cas d’utilisation tels que les assistants conversationnels, les agents IA, les applications mobiles et les services à forte demande.

Gemini 2.5 Flash : Raisonnement contrôlable et performances solides

Gemini 2.5 Flash prend en charge des entrées multimodales, y compris le texte, les images, l’audio et la vidéo, avec une fenêtre de contexte impressionnante de 1 million de tokens. Bien que ses performances soient légèrement inférieures à celles du modèle o4-mini d’OpenAI sur certains benchmarks, Gemini 2.5 Flash offre une solution plus économique avec des performances compétitives.

La tarification de Gemini 2.5 Flash est conçue pour offrir une flexibilité maximale :

Sans raisonnement : 0,15 dollar par millier de tokens en entrée et 0,60 dollar par millier de tokens en sortie.
Avec raisonnement activé : à partir de 3,50 dollars par millier de tokens, en fonction du budget de raisonnement défini.

Cette structure tarifaire permet aux développeurs de choisir le niveau de complexité et de coût adapté à leurs projets.

Disponibilité et intégration

Gemini 2.5 Flash est actuellement disponible en préversion via :

L’application Gemini.
Google AI Studio.
Vertex AI.

Les développeurs peuvent commencer à expérimenter avec ce modèle dès aujourd’hui en utilisant l’API Gemini. Il est important de noter que, bien que le modèle soit en préversion, il est déjà stable et prêt pour des tests en conditions réelles.

Avec Gemini 2.5 Flash, Google propose une solution innovante pour les développeurs et les entreprises recherchant un modèle d’IA performant, flexible et économique. Sa capacité à ajuster le niveau de raisonnement en fonction des besoins spécifiques en fait un outil précieux pour une large gamme d’applications.

Pour en savoir plus et commencer à utiliser Gemini 2.5 Flash, vous pouvez consulter la documentation officielle sur Google AI Studio ou Vertex AI.

Lire plus

Intelligence Artificielle

Stargate : Le méga-projet IA d’OpenAI s’étend au Royaume-Uni, Allemagne, France

par Yohann Poiron le 18 avril 2025

Le projet Stargate, une initiative colossale de 500 milliards de dollars menée par OpenAI, SoftBank et Oracle, envisage désormais d’étendre ses infrastructures d’intelligence artificielle (IA) au-delà des États-Unis, avec de potentiels investissements au Royaume-Uni, en Allemagne et en France.

Initialement conçu pour renforcer la suprématie américaine en matière d’IA, Stargate pourrait ainsi marquer une étape significative vers une expansion internationale.

Le Royaume-Uni se distingue comme une destination privilégiée pour cette expansion, grâce à la politique pro-innovation du Premier ministre Keir Starmer. Le gouvernement britannique s’efforce de faciliter l’accès à l’électricité pour les centres de données, un facteur crucial pour des infrastructures aussi énergivores que celles prévues par Stargate. Des initiatives analogues en Allemagne et en France renforcent également leur attractivité pour le projet.

Sam Altman, PDG d’OpenAI, a exprimé son intérêt pour la création d’un programme analogue à Stargate en Europe, soulignant l’importance pour le continent de ne pas prendre de retard dans le domaine de l’IA.

Objectifs et implications du projet

Stargate vise à construire une série de centres de données de grande envergure pour soutenir le développement de modèles d’IA avancés, tels que ceux d’OpenAI. Le projet prévoit de créer plus de 100 000 emplois aux États-Unis et pourrait générer des retombées économiques similaires en Europe si l’expansion se concrétise.

Cependant, des défis subsistent, notamment en ce qui concerne la capacité des infrastructures énergétiques locales à supporter une telle charge et les préoccupations liées à la concentration de pouvoir entre les mains de quelques entreprises technologiques majeures.

Perspectives pour la France

Pour la France, l’intérêt de Stargate représente une opportunité majeure de renforcer sa position dans le secteur de l’IA. Le gouvernement français pourrait tirer parti de cette initiative pour stimuler l’innovation, créer des emplois et attirer des investissements étrangers. Cependant, cela nécessitera une coordination étroite entre les autorités publiques et les acteurs privés pour garantir que les infrastructures nécessaires soient en place et que les préoccupations éthiques et environnementales soient prises en compte.

En somme, l’expansion potentielle de Stargate en Europe pourrait redéfinir le paysage de l’IA sur le continent, offrant à des pays comme la France une occasion unique de jouer un rôle de premier plan dans ce domaine en pleine croissance.

Lire plus

Intelligence Artificielle

OpenAI : ChatGPT peut désormais raisonner avec les images

par Yohann Poiron le 18 avril 2025

OpenAI continue de repousser les limites de l’intelligence artificielle en intégrant un raisonnement visuel avancé dans ChatGPT. Avec l’arrivée de ses nouveaux modèles o3 et o4-mini, la plateforme ne se contente plus d’analyser les textes : elle est désormais capable de véritablement « penser avec les images ». Une avancée majeure qui transforme l’usage de l’IA dans la génération de contenu, le codage, les analyses visuelles et bien plus encore.

Décrit comme le modèle de raisonnement le plus puissant d’OpenAI, o3 est une évolution significative, surpassant les modèles GPT-4.1 et GPT-4.5. Il excelle dans les domaines du codage, des mathématiques, des sciences, et surtout de la perception visuelle. En parallèle, o4-mini, plus léger, vise un équilibre entre performance et rapidité, parfait pour les usages à faible coût.

ChatGPT peut désormais « raisonner avec des images »

Ce qui rend ces modèles révolutionnaires, c’est leur capacité à intégrer les images dans leur processus de réflexion. OpenAI explique que o3 et o4-mini peuvent désormais analyser, manipuler et exploiter les éléments visuels au même titre que le texte.

Cela inclut :

le recadrage, le zoom, ou la rotation d’images,
l’analyse de diagrammes complexes, de notes manuscrites ou de schémas techniques,
la compréhension contextuelle de scènes réelles capturées en photo.

Il ne s’agit plus seulement de générer des images sur demande : ces modèles peuvent extraire du sens à partir de visuels, enrichir leur interprétation, et générer des réponses plus pertinentes et nuancées.

Une IA multimodale plus proche de la réalité

Cette avancée rapproche ChatGPT de Gemini de Google, qui impressionne par sa capacité à interpréter des flux vidéo en direct. OpenAI semble vouloir poser les fondations d’agents IA capables de raisonner en combinant texte, image, données et code.

Ces nouvelles capacités permettent des cas d’usage concrets, comme :

décrypter une capture d’écran d’interface utilisateur,
analyser une photo de tableau blanc prise en réunion,
expliquer une œuvre d’art simplement via l’appareil photo,
proposer des solutions à partir d’un croquis ou d’un graphique.

Un accès réservé aux abonnés… pour le moment

Pour éviter une surcharge de ses ressources, OpenAI limite l’accès aux modèles o3, o4-mini et o4-mini-high aux utilisateurs ChatGPT Plus, Pro et Team. Les clients Enterprise et Education y auront accès dans une semaine. Quant aux utilisateurs gratuits, ils peuvent accéder à o4-mini via l’option « Think » dans la barre de saisie, mais avec des fonctionnalités limitées.

Avec o3 et o4-mini, ChatGPT entre dans une nouvelle ère de raisonnement multimodal, où les images sont traitées comme une source d’information à part entière. Cette évolution ouvre la voie à des assistants IA toujours plus intelligents, capables de comprendre, analyser et réagir à notre monde visuel avec une précision inégalée.

Lire plus

Edits fête sa première année : Instagram veut transformer son appli de montage en véritable studio créatif mobile

Meta renforce le contrôle parental sur l’IA : une réponse tardive… mais stratégique

« Vibe working » : Comment Microsoft 365 réinvente la productivité avec ses agents ?

Xbox Game Pass Starter Edition : Microsoft préparerait une offre allégée avec Discord Nitro

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

Test Huawei MatePad 11.5 : La tablette PaperMatte, l’alliée idéale pour les étudiants et pros ?

Pixel 11 Pro Fold : Android 17 révèle peut-être ses coloris Pine et Midnight

OnePlus 16 : écran 240 Hz, Snapdragon 8 Elite Gen 6 Pro et batterie 9000 mAh, que disent les fuites ?

Honor 600 Pro : au lieu de parler autonomie, Honor la met en scène avec une course de voitures téléguidées

Essential Voice : Nothing veut rendre la dictée vocale enfin plus propre, plus utile et moins robotique

DeepSeek V4 : la Chine relance l’offensive open source face à OpenAI et Google

Claude ajoute Spotify, Uber, Instacart et Audible : Anthropic veut faire de son IA un assistant du quotidien

GPT-5.5 : OpenAI accélère vers son « superapp » avec un modèle plus agentique et plus performant

Claude Code : L’outil devenu trop cher pour rester dans le plan Pro ?

DJI Mic Mini 2S : un micro sans fil plus avancé avec 4 émetteurs et enregistrement interne ?

DeepSeek V4 : la Chine relance l’offensive open source face à OpenAI et Google

Claude ajoute Spotify, Uber, Instacart et Audible : Anthropic veut faire de son IA un assistant du quotidien

GPT-5.5 : OpenAI accélère vers son « superapp » avec un modèle plus agentique et plus performant

Chronicle : OpenAI transforme Codex en assistant contextuel (et ça change tout)

OpenAI Codex : Pourquoi vous n’allez plus jamais quitter votre IDE ?

Google Colab : Pourquoi Gemini ne va plus seulement coder à votre place ?

Swift 6.3 : La révolution secrète d’Apple pour conquérir Android

Claude Cowork : Le guide complet pour automatiser votre quotidien en 2026

Intel Core Ultra vs Apple Silicon : Quelle philosophie choisir pour votre prochain bureau compact ?

Comment arrêter le suivi des e-mails dans Gmail ?

Claude Code vs ChatGPT Codex : Quel agent choisir pour votre workflow en 2026 ?

Intelligence Artificielle

DeepSeek V4 : la Chine relance l’offensive open source face à OpenAI et Google

Claude ajoute Spotify, Uber, Instacart et Audible : Anthropic veut faire de son IA un assistant du quotidien

GPT-5.5 : OpenAI accélère vers son « superapp » avec un modèle plus agentique et plus performant

Claude Code : L’outil devenu trop cher pour rester dans le plan Pro ?

Google Deep Research et Deep Research Max : l’IA devient un véritable analyste autonome

Siri sous Gemini : Google tease la future refonte de l’assistant d’Apple lors de Cloud Next 2026