Anthropic : levée de fonds record de 3,5 milliards de dollars, valorisation à 61,5 milliards !

par Yohann Poiron le 27 février 2025

La startup d’intelligence artificielle Anthropic, créatrice du chatbot Claude, est en passe de finaliser une levée de fonds massive de 3,5 milliards de dollars, bien au-delà de son objectif initial de 2 milliards. Selon le Wall Street Journal, ce montant aurait été augmenté au fil des discussions avec les investisseurs.

Grâce à cette levée de fonds, Anthropic atteindrait une valorisation de 61,5 milliards de dollars, un bond spectaculaire par rapport aux 18 milliards de dollars de sa précédente valorisation. Parmi les investisseurs de ce tour de table figurent Lightspeed Venture Partners, General Catalyst et Bessemer Venture Partners, ainsi qu’un fonds d’investissement basé à Abu Dhabi, MGX, qui serait en discussion pour rejoindre le projet.

Cette transaction intervient dans un contexte de questionnement sur l’avenir du secteur de l’intelligence artificielle, alors que certains experts s’interrogent sur la capacité de l’industrie à maintenir son rythme de croissance fulgurant.

Le financement d’Anthropic survient alors que le secteur de l’IA a été secoué par l’émergence de DeepSeek, une entreprise chinoise qui a récemment dévoilé un modèle concurrent des grandes entreprises américaines.

DeepSeek s’est fait remarquer en développant un modèle libre d’accès et conçu avec des coûts nettement inférieurs, mettant potentiellement en péril la domination des géants américains du secteur.

Anthropic et l’impact de DeepSeek

L’impact de cette compétition s’est également fait ressentir sur NVIDIA, acteur clé du boom de l’intelligence artificielle. En janvier, l’action de la société a chuté de 17 % en une seule journée après que DeepSeek a annoncé avoir entraîné son modèle avec un nombre de GPU bien inférieur à ce qui était habituellement nécessaire. NVIDIA a depuis récupéré une partie de cette perte, mais les analystes surveillent avec attention la publication de son rapport financier ce mercredi 26 février, prévu après la clôture des marchés aux États-Unis.

Malgré la montée en puissance des alternatives chinoises, la levée de fonds d’Anthropic démontre que les investisseurs restent confiants dans l’avenir des entreprises américaines d’IA. Reste à voir si cette dynamique pourra se maintenir alors que la compétition mondiale s’intensifie et que les coûts de développement de l’intelligence artificielle continuent d’évoluer.

Lire plus

Intelligence Artificielle

Microsoft Copilot : L’IA accessible à tous, avec voix et raisonnement avancés gratuits !

par Yohann Poiron le 26 février 2025

Microsoft propose désormais des fonctionnalités illimitées Copilot Voice et Think Deeper pour les utilisateurs gratuits. Ces fonctionnalités avancées étaient déjà disponibles pour les utilisateurs non payants, mais elles étaient limitées par des limites d’utilisation quotidienne.

Comme vous pouvez le supposer, le mode vocal vous permet de communiquer avec Copilot par le biais du langage parlé. Vous pouvez accéder au mode vocal en appuyant sur le bouton du microphone situé sur le côté droit de la fenêtre d’invite Copilot. Il propose quatre voix prédéfinies différentes, ainsi qu’une animation onirique d’un peu d’eau lorsqu’il est accessible à partir d’un navigateur de bureau.

Copilot Think Deeper est une implémentation du modèle de raisonnement o1 d’OpenAI. Il s’agit d’un chatbot qui « réfléchit » à travers ses réponses, se vérifiant efficacement pour détecter les informations erronées, les hallucinations ou les réponses généralement médiocres.

Pour utiliser Think Deeper, appuyez simplement sur le gros bouton « Think Deeper » dans la fenêtre d’invite Copilot, situé juste à côté du bouton du microphone.

OpenAI facture à ses clients le modèle o1, donc un accès gratuit illimité dans Copilot est une affaire assez importante. Il en va de même pour le mode vocal ChatGPT, auquel les utilisateurs gratuits ne peuvent accéder que dans une mesure limitée.

Les comptes Copilot gratuits peuvent subir des retards ou des interruptions

Cependant, Microsoft note que les comptes Copilot gratuits peuvent subir des retards ou des interruptions pendant les heures de pointe d’utilisation. Ceux qui paient 20 dollars par mois pour Copilot Pro bénéficient d’un accès prioritaire à toutes les fonctionnalités et ne devraient pas subir de retards, sauf dans des circonstances extrêmes ou inhabituelles.

En outre, l’utilisation illimitée du mode vocal et de Think Deeper nécessite une connexion Microsoft. Si vous atteignez une limite de débit, connectez-vous à un compte.

« Les utilisateurs de Copilot se sont exprimés ! Nous avons constaté une croissance incroyable pour Voice et Think Deeper, et de plus en plus de personnes nous disent avoir atteint ces limites d’utilisation. Alors… nous nous en débarrassons », a déclaré Mustafa Suleyman, PDG de Microsoft AI.

Lors de mes tests, le mode Think Deeper de Copilot a fourni des réponses plus précises et plus complètes que le mode chatbot standard de Copilot. Il est clair que le modèle de raisonnement o1 d’OpenAI, qui a été rendu public après que DeepSeek a secoué le monde en janvier, est efficace pour affiner et transmettre des informations. Il n’est pas parfait et il servira parfois à la désinformation ou aux hallucinations, mais c’est un bon outil pour la recherche ou le brainstorming.

Un mode vocal réellement utile ?

Le mode vocal de Copilot est un outil différent, plus spécialisé. Si vous souhaitez simplement avoir une conversation amicale avec un chatbot, organiser un entretien simulé ou pratiquer une langue étrangère, le mode vocal fait l’affaire. Mais il ne peut pas faciliter une recherche ou une analyse approfondie. Ses réponses sont tronquées pour des raisons de concision, ce qui limite naturellement son utilité dans ces domaines. Et, plus importants encore, les humains ne sont pas très doués pour cracher des prompts d’IA parfaitement précises.

Il faut reconnaître que le mode vocal de Copilot est étonnamment rapide et articulé. Et l’entreprise ne fait aucun scrupule quant à son utilité : dans son dernier article de blog, Microsoft suggère aux gens d’utiliser le mode vocal comme un ballon de volley linguistique et ne fait aucune mention de la recherche ou d’autres fonctions que nous associons plus communément aux chatbots.

Lancez Copilot et connectez-vous à votre compte pour tester le mode vocal à accès illimité ou Think Deeper. Là encore, si Copilot semble lent, attendez quelques heures et réessayez.

Lire plus

Intelligence Artificielle

OpenAI : ChatGPT se met à la voix et à la recherche avancée, avec des nouveautés pour tous !

par Yohann Poiron le 26 février 2025

OpenAI vient d’annoncer sur X le déploiement d’une version preview du Mode vocal avancé pour les utilisateurs gratuits de ChatGPT, tout en étendant l’accès à son agent Deep Research à tous les abonnés Plus, Team, Edu et Enterprise.

Mode vocal avancé désormais accessible aux utilisateurs gratuits

Jusqu’à présent réservé aux abonnés ChatGPT Plus, le Mode vocal avancé est l’une des fonctionnalités les plus immersives de ChatGPT. Ce mode permet d’interagir vocalement avec le chatbot dans une conversation fluide et naturelle, offrant une expérience plus proche d’un échange avec un humain. Il est même possible d’interrompre l’IA lorsque ses réponses sont trop longues.

Depuis novembre dernier, cette fonctionnalité était disponible sur les versions mobile et de bureau de ChatGPT pour les abonnés payants. Désormais, OpenAI donne aux utilisateurs gratuits la possibilité de l’essayer quotidiennement, bien que la limite exacte d’utilisation ne soit pas précisée. L’entreprise semble vouloir ajuster cette limite en fonction de la demande.

Starting today, we’re rolling out a version of Advanced Voice powered by GPT-4o mini to give all ChatGPT free users a chance to preview it daily across platforms.

The natural conversation pace and tone are similar to the GPT-4o version while being more cost effective to serve.

— OpenAI (@OpenAI) February 25, 2025

Pour les abonnés ChatGPT Plus, l’accès reste plus avantageux avec une limite 5x supérieure à celle des utilisateurs gratuits. De plus, ces abonnés continuent de bénéficier du Mode vocal avancé basé sur ChatGPT 4 o, tandis que la version gratuite fonctionne avec ChatGPT 4o-mini, un modèle potentiellement moins performant.

L’annonce a provoqué diverses réactions sur X, certains utilisateurs regrettant que la version gratuite repose sur un modèle allégé. D’autres s’interrogent sur la limite quotidienne imposée aux abonnés payants, estimant que ceux qui paient devraient bénéficier d’une expérience illimitée.

Deep Research désormais accessible à tous les abonnés payants

En parallèle, OpenAI élargit l’accès à son agent Deep Research. Auparavant réservé aux abonnés Pro (200 dollars/mois), cet outil est désormais disponible pour les abonnés Plus, Team, Edu et Enterprise.

Les abonnés à ChatGPT Pro conservent 120 requêtes Deep Research par mois, leur offrant un accès plus étendu aux capacités avancées de l’IA. En revanche, ceux souscrivant aux plans Plus, Team, Edu et Enterprise ne disposent que de 10 requêtes par mois, ce qui pourrait limiter l’usage intensif de cette fonctionnalité.

Deep Research s’appuie sur le modèle o3, optimisé pour l’analyse de données, et permet d’explorer des centaines de sources en ligne en quelques minutes. Contrairement à une simple recherche Web, l’agent est capable de synthétiser et d’analyser du texte, des images et des fichiers PDF, offrant ainsi un gain de temps considérable aux chercheurs et analystes.

Ce déploiement marque une étape importante dans la stratégie d’OpenAI, qui cherche à rendre ses outils IA plus accessibles, tout en maintenant une différenciation claire entre les offres gratuites et payantes.

OpenAI mise sur une démocratisation progressive de ses fonctionnalités IA

Avec ces nouvelles annonces, OpenAI continue de tester l’engagement des utilisateurs sur ses fonctionnalités premium, tout en élargissant progressivement leur accès.

Si la mise à disposition du Mode vocal avancé aux utilisateurs gratuits est une avancée notable, la limite quotidienne reste un frein pour ceux qui souhaiteraient l’utiliser plus fréquemment. De même, l’élargissement de Deep Research à tous les abonnés payants confirme la volonté d’OpenAI de rendre son IA plus utile aux professionnels, mais avec un modèle économique qui continue de privilégier les formules premium.

En 2025, OpenAI prévoit d’aller encore plus loin avec la sortie du modèle GPT-5, également connu sous le nom de o3. Ce dernier devrait être mis gratuitement à disposition de tous les utilisateurs, renforçant ainsi la stratégie d’OpenAI visant à démocratiser l’intelligence artificielle tout en incitant les utilisateurs à souscrire aux formules payantes pour bénéficier de fonctionnalités plus avancées.

Ces évolutions laissent entrevoir une potentielle généralisation des outils IA avancés, avec peut-être, à terme, un accès encore plus étendu aux utilisateurs gratuits.

Lire plus

Intelligence Artificielle

Gemini : l’IA de Google peut enfin générer des images de personnes !

par Yohann Poiron le 25 février 2025

Après des mois de limitations, Google permet enfin aux utilisateurs gratuits de Gemini de générer des images contenant des personnes. Cette mise à jour marque une avancée majeure pour Imagen, le moteur de génération d’images de Google, qui souffrait jusqu’ici d’un handicap majeur face à des concurrents comme DALL·E.

Jusqu’à récemment, la génération d’images avec des personnes était réservée aux abonnés de Gemini Advanced, dans le cadre d’un accès anticipé. Désormais, les utilisateurs gratuits peuvent aussi en profiter, bien que le déploiement soit encore progressif.

Ce qui change :

Vous pouvez maintenant demander à Gemini de créer des images incluant des personnes.
Les images générées sont généralement réalistes et bien détaillées.
Les limites sur la diversité aléatoire des visages semblent mieux gérées qu’avant.

Les restrictions encore en place :

Impossible de générer des personnalités célèbres ou des figures politiques.
Gemini refuse toujours certaines requêtes ambiguës ou sensibles.

Si vous demandez « un couple qui fait du parachutisme », Gemini générera l’image sans problème. Mais demandez une personne spécifique, et l’IA refusera.

Un retour dans Gemini après un lancement problématique

Pourquoi Google avait-il désactivé cette fonction pendant des mois ? Lors de son lancement initial avec Imagen 3 en août 2024, la gestion des visages et de la diversité posait problème. L’IA appliquait des paramètres de diversité trop aléatoires, ce qui menait à des résultats aberrants, comme un George Washington noir ou d’autres incohérences historiques.

Face aux critiques, Google a préféré suspendre la fonction plutôt que de risquer des polémiques, promettant un retour rapide… qui a finalement pris plusieurs mois. Ce n’est qu’avec une nouvelle génération de modèle et un reparamétrage en profondeur que cette fonctionnalité fait son retour.

Toujours pas disponible partout

Google déploie cette mise à jour progressivement, ce qui signifie que tous les utilisateurs gratuits ne l’ont pas encore. Pour accéder immédiatement aux fonctionnalités avancées, il faut encore souscrire à Gemini Advanced, qui propose des modèles plus expérimentaux et des outils exclusifs.

Si Google rattrape enfin son retard face à la concurrence et propose des images réalistes avec des humains, il reste des restrictions sur les personnalités et un déploiement progressif qui peut frustrer certains utilisateurs.

Reste à voir comment Google va continuer à améliorer cette technologie et si elle pourra rivaliser pleinement avec DALL·E et d’autres générateurs d’images avancés.

Lire plus

Intelligence Artificielle

Claude 3.7 Sonnet : l’IA hybride d’Anthropic qui défie OpenAI et GPT-5 !

par Yohann Poiron le 25 février 2025

Anthropic vient de dévoiler Claude 3.7 Sonnet, son tout premier modèle de raisonnement hybride, conçu pour résoudre des problèmes plus complexes et surpasser ses prédécesseurs dans des domaines clés comme les mathématiques et le codage.

Mais ce n’est pas tout. En plus de cette mise à jour, l’entreprise lance un aperçu limité de Claude Code, un nouvel outil d’IA « agentique » destiné aux développeurs. Contrairement aux solutions existantes, Claude Code ne se contente pas de générer du code, il peut rechercher et analyser du code, éditer des fichiers, exécuter des tests, gérer des commits GitHub et utiliser des outils en ligne de commande.

Claude 3.7 Sonnet : une IA plus puissante et plus polyvalente

Disponible dès aujourd’hui sur l’application Claude ainsi que via l’API d’Anthropic, Amazon Bedrock et Google Cloud Vertex AI, ce nouveau modèle offre des améliorations majeures tout en conservant le même coût que Claude 3,5 Sonnet :

3 dollars par million de tokens en entrée
15 dollars par million de tokens en sortie

Contrairement à OpenAI et d’autres concurrents qui développent des modèles spécialisés en raisonnement, Anthropic veut unifier toutes ces capacités au sein d’un seul modèle. Selon Dianne Penn, responsable de la recherche produit chez Anthropic, le raisonnement doit être une fonctionnalité inhérente à l’IA, et non une catégorie distincte.

Exemple concret : répondre à « Quelle heure est-il ? » ne doit pas nécessiter le même niveau de raisonnement que planifier un voyage de deux semaines en Italie en fonction de la météo de fin mars. Claude 3.7 Sonnet est conçu pour adapter son raisonnement en fonction de la complexité de la demande.

Des performances accrues en codage, finance et droit

Codage avancé : Claude 3.7 Sonnet se démarque en « codage agentique », un concept où l’IA ne se limite pas à suggérer des lignes de code, mais participe activement à la conception, l’édition et l’optimisation des programmes.
Finance et droit : Des gains de performance significatifs sont aussi notés dans ces secteurs où la compréhension fine du contexte et des réglementations est cruciale.
Mise à jour des connaissances : Claude 3.7 Sonnet ne dispose toujours pas d’un accès en temps réel au Web, mais sa base de connaissances est à jour jusqu’en octobre 2024, le rendant plus pertinent que les précédentes versions.
Contrôle précis des réponses : Les développeurs peuvent dicter la manière dont le modèle réfléchit et fixer une durée maximale pour obtenir une réponse. Par exemple, si une réponse ne doit pas dépasser 200 millisecondes, ils peuvent en faire une contrainte produit.

Claude Code : un assistant IA qui va plus loin que les autres

Avec Claude Code, Anthropic pousse l’IA générative encore plus loin. Ce nouvel outil permet aux développeurs de :

Éditer et optimiser du code en continu
Créer et exécuter des tests automatisés
Interagir directement avec GitHub pour gérer commits et push
Utiliser des commandes terminal pour exécuter des scripts et analyser des fichiers

En interne, les ingénieurs d’Anthropic ont utilisé Claude Code pour concevoir des sites Web, des jeux interactifs et même passer 45 minutes à ajuster des séries de tests en continu.

L’une des méthodes les plus originales pour tester Claude 3.7 Sonnet a été de lui faire jouer à Pokémon en liant son API à un schéma de contrôle. Résultat ? Claude 3,5 Sonnet ne parvenait pas à quitter Bourg Palette, tandis que Claude 3.7 a réussi à vaincre plusieurs champions d’arène.

Une course à l’IA qui s’accélère

Après la récente présentation de Grok-3 par Elon Musk, il est clair que la compétition dans le domaine de l’IA s’intensifie. Cependant, avec Claude 3.7 Sonnet, Anthropic semble reprendre la tête en misant sur une IA plus complète, plus flexible et mieux intégrée.

L’avenir de l’IA se dirige-t-il vers des modèles uniques capables de tout faire ? Claude 3.7 Sonnet laisse penser que oui.

Lire plus

Intelligence Artificielle

DeepSeek : l’IA chinoise ouvre son code source et renforce la transparence !

par Yohann Poiron le 24 février 2025

La startup chinoise qui a révolutionné le monde de l’IA avec ses modèles open source, DeepSeek, annonce une nouvelle étape vers la transparence. Dès cette semaine, DeepSeek rendra publics plusieurs référentiels de code, offrant aux développeurs et aux chercheurs un accès privilégié aux coulisses de ses technologies.

DeepSeek, qui s’est imposé comme un acteur majeur de l’IA grâce à ses modèles open source performants, va encore plus loin dans la transparence en ouvrant l’accès à son code source. Cette démarche permettra de mieux comprendre les technologies de DeepSeek et de lever les éventuelles inquiétudes quant à leur utilisation.

En rendant son code source accessible, DeepSeek renforce la confiance des utilisateurs et des développeurs envers ses technologies. Cette transparence pourrait contribuer à accroître la popularité des modèles d’IA de DeepSeek et à accélérer leur adoption.

🚀 Day 0: Warming up for #OpenSourceWeek!

We’re a tiny team @deepseek_ai exploring AGI. Starting next week, we’ll be open-sourcing 5 repos, sharing our small but sincere progress with full transparency.

These humble building blocks in our online service have been documented,…

— DeepSeek (@deepseek_ai) February 21, 2025

C’est une décision particulièrement audacieuse pour une entreprise technologique. Cependant, les décisions audacieuses sont déjà monnaie courante pour DeepSeek, qui est entré dans l’espace de l’IA en tant que perturbateur de l’industrie. Elle s’est particulièrement distinguée parce que ses modèles ont obtenu des résultats aussi bons, voire meilleurs, que ceux de nombreuses grandes marques d’IA du secteur, telles que OpenAI et Meta, qui utilisent des technologies propriétaires.

« Nous sommes une petite équipe qui explore l’AGI. À partir de la semaine prochaine, nous allons ouvrir le code source de 5 référentiels, en partageant nos progrès modestes, mais sincères en toute transparence », a déclaré DeepSeek sur X.

DeepSeek veut répondre aux préoccupations en matière de sécurité

L’ouverture du code source de DeepSeek pourrait également aider l’entreprise à apaiser les inquiétudes soulevées par certaines entités gouvernementales concernant la sécurité de ses technologies, notamment celles des États-Unis, de Corée du Sud, d’Australie et de Taïwan.. Le public pourra voir que « chaque ligne de code, fichier de configuration et élément de données y vivent ensemble », a noté la société.

DeepSeek réaffirme son engagement en faveur de l’open source et de la collaboration au sein de la communauté de l’IA. L’entreprise souhaite contribuer à l’accélération de l’innovation en partageant ses connaissances et en encourageant le développement collaboratif.

« En tant que membre de la communauté open source, nous pensons que chaque ligne partagée devient un élan collectif qui accélère le voyage… Pas de tours d’ivoire — juste de l’énergie pure de garage et de l’innovation axée sur la communauté », a déclaré DeepSeek.

Lire plus

Intelligence Artificielle

ERNIE Bot : L’IA de Baidu devient gratuite pour tous le 1er avril !

par Yohann Poiron le 21 février 2025

Baidu a annoncé que ERNIE Bot sera entièrement gratuit pour tous les utilisateurs dès le 1ᵉʳ avril 2025. Le chatbot sera accessible sur desktop et mobile, et offrira un accès total aux derniers modèles d’IA de Baidu, sans frais.

ERNIE Bot proposera plusieurs outils avancés, dont :

Traitement avancé des documents : meilleure gestion et analyse des fichiers.
Recherche intelligente : des résultats plus précis grâce à une IA optimisée.
Peinture IA avancée : génération d’images de haute qualité.
Conversations multilingues : support de plusieurs langues pour une meilleure accessibilité.

Just in: We’re rolling out the ERNIE 4.5 model series in the coming months and plan to open source the models from June 30th.

Curious about what’s coming next? pic.twitter.com/cly6mx1hKr

— Baidu Inc. (@Baidu_Inc) February 14, 2025

Cette annonce intervient alors que de nouveaux concurrents, comme DeepSeek, viennent perturber l’industrie et intensifier la bataille pour le développement de la prochaine génération d’IA.

Nouvelle fonction Deep Search pour Baidu

Baidu introduit Deep Search, une fonctionnalité permettant un raisonnement plus approfondi et une meilleure planification des tâches complexes. Cette technologie offrira des réponses de niveau expert et une meilleure gestion des requêtes grâce à ses capacités avancées d’appel d’outils.

Disponibilité : Sur le site officiel d’ERNIE Bot dès le 1ᵉʳ avril, avec une version mobile à venir.

Cette gratuité de ERNIE Bot pourrait intensifier la bataille tarifaire entre Baidu, Alibaba et ByteDance. En parallèle, DeepSeek a secoué l’industrie en 2025 avec un modèle avancé entraîné à moindre coût, ce qui lui a permis de gagner en adoption, notamment auprès des agences locales. Alibaba, quant à lui, a consolidé sa position grâce à son modèle Qwen, qui rivalise avec Llama (Meta) et DeepSeek V3 dans plusieurs tests de performance.

Exciting news! ERNIE Bot will be free for all users starting April 1. Users will have access to all advanced features on desktop & mobile versions of the app.

We’re also launching Deep Search, a new function with enhanced thinking, planning, and tool-calling, delivering… pic.twitter.com/AoQlTK5b6v

— Baidu Inc. (@Baidu_Inc) February 13, 2025

ERNIE Bot : une croissance fulgurante

En novembre 2024, ERNIE Bot comptait 430 millions d’utilisateurs, avec plus de 1,5 milliard d’appels API par jour — une augmentation 30 fois supérieure à 2023.

Bien que ChatGPT ne soit pas officiellement disponible en Chine, certains utilisateurs y accèdent via VPN. Malgré cela, ERNIE Bot domine le marché chinois grâce à son adoption massive et ses intégrations en entreprise.

Respect des régulations en Chine

ERNIE Bot suit strictement les politiques de censure chinoises, évitant les sujets politiques sensibles. À l’inverse, les réponses de ChatGPT circulent largement sur les réseaux sociaux chinois, mais Baidu garantit que son IA respecte les réglementations locales tout en offrant des fonctionnalités avancées.

Avec cet accès gratuit, ERNIE Bot pourrait encore renforcer sa position sur le marché de l’IA en Chine !

Lire plus

Intelligence Artificielle

GPT-4.5 et GPT-5 : Microsoft prêt à héberger les nouveaux modèles d’OpenAI !

par Yohann Poiron le 21 février 2025

Sam Altman, responsable de OpenAI, a récemment révélé que GPT 4.5 et GPT-5 allaient être introduites dans les semaines et les mois à venir. Aujourd’hui, un rapport de The Verge indique que Microsoft prépare ses serveurs à héberger les modèles GPT-5 et GPT-4.5. Le rapport indique également que Microsoft pourrait héberger le modèle GPT-4.5 (nom de code « Orion ») dès la semaine prochaine.

Par ailleurs, le modèle GPT-5 de nouvelle génération d’OpenAI pourrait être lancé d’ici le mois de mai. Il est important de noter que le géant de Redmond organise sa conférence annuelle Microsoft Build 2025 pour les développeurs du 19 au 22 mai. À peu près au même moment, Google organisera sa conférence de développeurs I/O 2025 les 20 et 21 mai.

Il faut donc s’attendre à ce que les trois grandes entreprises fassent des annonces majeures à la fin du mois de mai. Par ailleurs, Microsoft devrait intégrer les modèles GPT-4.5 et GPT-5 d’OpenAI dans son application Copilot. Récemment, l’entreprise a ajouté la prise en charge du modèle de raisonnement o1 d’OpenAI sur Copilot via l’outil Think Deeper, qui est gratuit pour tous les utilisateurs.

Ensuite, Microsoft prépare sa propre version de l’agent d’IA Operator d’OpenAI. Il vous permet de déléguer des tâches à l’agent et celui-ci se rend sur le Web pour effectuer des actions pour vous de manière autonome. Par ailleurs, Microsoft a récemment dévoilé Muse, un modèle d’action mondiale et humaine (WHAM) capable de générer des visuels de jeux vidéo et des actions de contrôle.

Certains des jeux alimentés par l’IA seront bientôt disponibles sur Copilot Labs.

GPT-5, le nouveau must-have de OpenAI !

Au cas où vous ne le sauriez pas, GPT-4.5 sera un modèle de langage traditionnel et GPT-5 sera un système d’IA unifié, qui combinera son modèle de raisonnement o3 et d’autres outils ChatGPT. Récemment, Altman a tweeté : « L’essai de GPT-4.5 a été beaucoup plus un moment de “sentir l’AGI” parmi les testeurs de haut niveau que ce à quoi je m’attendais ! ».

trying GPT-4.5 has been much more of a “feel the AGI” moment among high-taste testers than i expected!

— Sam Altman (@sama) February 17, 2025

Il faut donc s’attendre à ce que GPT-5 soit encore plus puissant. D’ailleurs, Anthropic s’apprête également à lancer son modèle « Thinking » dans les prochains jours.

Lire plus

Intelligence Artificielle

ChatGPT : 400 millions d’utilisateurs et 2 millions d’entreprises, le succès fulgurant de l’IA !

par Yohann Poiron le 21 février 2025

OpenAI, le créateur de ChatGPT, annonce avoir atteint 400 millions d’utilisateurs actifs par semaine en février, soit une augmentation de 33 % en moins de trois mois. Ce chiffre, en hausse par rapport aux 300 millions d’utilisateurs enregistrés en décembre 2024, confirme le succès grandissant de ChatGPT. Cette croissance confirme le succès de ChatGPT auprès du grand public et des entreprises, malgré la concurrence de xAI, DeepSeek, Mistral et d’autres acteurs majeurs.

chatgpt recently crossed 400M WAU, we feel very fortunate to serve 5% of the world every week

2M+ business users now use chatgpt at work, and reasoning model API use is up 5x since o3 mini launch

we’ll bring GPT-4.5 and GPT-5 to chat and the API soon, with unlimited GPT-5 for… https://t.co/7hfyUcIyBW

— Brad Lightcap (@bradlightcap) February 20, 2025

Brad Lightcap, directeur de l’exploitation d’OpenAI, attribue cette croissance à l’ajout de nouvelles fonctionnalités et à la familiarisation du public avec ChatGPT. L’entreprise a également vu son activité en direction des entreprises doubler depuis septembre 2024, avec 2 millions de clients payants.

Des entreprises comme Morgan Stanley, Uber et T-Mobile ont intégré les modèles d’OpenAI dans leurs workflows, utilisant l’IA pour générer des rapports, automatiser le service client et optimiser la prise de décision.

L’utilisation des API pour les développeurs a également doublé au cours des 6 derniers mois, avec une augmentation de quatre fois l’utilisation du modèle de raisonnement o3.

Malgré l’impact de DeepSeek sur le marché de l’IA, OpenAI reste confiant dans sa position de leader. Les statistiques montrent que ChatGPT reste l’outil d’IA le plus utilisé, avec 139,3 millions de visites quotidiennes fin janvier, contre 49 millions pour DeepSeek.

OpenAI travaille sur le futur

OpenAI reconnaît avoir pris du retard sur le développement open source, mais maintient que ce n’est pas sa priorité principale. L’entreprise envisage toutefois de rendre certains de ses anciens modèles d’IA open source à l’avenir. OpenAI prépare le lancement de GPT-4.5 et GPT-5, ce dernier fusionnant les modèles GPT et séries o en un seul système plus puissant. GPT-5 sera accessible gratuitement aux utilisateurs, y compris pour des applications de raisonnement avancé.

OpenAI continue de dominer le marché de l’IA générative, avec une croissance impressionnante de son audience et de son activité en direction des entreprises. La concurrence s’intensifie, mais OpenAI reste confiant dans sa capacité à innover et à proposer des solutions d’IA performantes et accessibles.—

Lire plus

Intelligence Artificielle

Gemini Live : Des sous-titres en temps réel pour une meilleure accessibilité !

par Yohann Poiron le 20 février 2025

Gemini Live se distingue des assistants vocaux traditionnels par une expérience plus interactive et fluide, permettant des conversations naturelles avec l’IA. Cependant, son fonctionnement exclusivement vocal pose problème en environnements bruyants et pour les personnes malentendantes.

Selon Android Authority, la dernière bêta de l’application Google (v16.6.23) intègre des références à une nouvelle fonctionnalité : les sous-titres en temps réel pour les réponses de Gemini Live.

Fonctionnement :

Un bouton permettra d’afficher les réponses sous forme de texte.
Une option “Préférences de sous-titres” dans les paramètres de Gemini Live offrira des réglages sur la taille et le style du texte.

Une meilleure accessibilité pour tous :

Facilite l’utilisation en public ou en milieux bruyants.
Améliore l’accessibilité pour les personnes sourdes ou malentendantes.
Rend l’outil moins intrusif dans les espaces partagés.

Gemini Live : une IA collaborative et gratuite

D’abord réservé aux utilisateurs Gemini Advanced, Gemini Live est désormais gratuit sur Android et iOS. Il permet de brainstormer, planifier des événements, organiser des projets professionnels, tout en facilitant la collaboration avec des images et vidéos.

Les sous-titres restent en phase de test et ne sont pas encore déployés au grand public. Google pourrait les annoncer officiellement dans une prochaine mise à jour.

Lire plus

Intelligence Artificielle

Gemini : L’IA de Google bientôt capable de générer des vidéos ?

par Yohann Poiron le 19 février 2025

Des indices découverts dans le code de l’application Google suggèrent que Gemini, l’assistant numérique basé sur l’IA de Google, pourrait bientôt être capable de générer des vidéos. Cette nouvelle fonctionnalité potentielle relierait Gemini à la plateforme existante de génération vidéo par IA de Google. Bien que non encore disponible, la présence de code lié à « videogen » indique que Google explore activement cette possibilité, même si sa sortie effective reste incertaine.

Gemini, l’assistant numérique de Google propulsé par l’IA, ne cesse d’évoluer. Les récentes mises à jour ont mis l’accent sur l’amélioration de la compréhension contextuelle, la simplification de la gestion des fichiers et l’activation d’interactions plus fluides entre les différentes applications.

Des extraits de code trouvés dans la version 16.6.23 de l’application Google font référence à « videogen » aux côtés de « robin », le nom de code associé à Gemini dans l’application. Cette association suggère un lien entre la génération vidéo et Gemini.

L’analyse du code révèle également des chaînes de caractères telles que « Travail en cours… » et « Nous vous informerons lorsqu’il sera prêt », indiquant une fonctionnalité en cours de développement. Bien que l’étendue des capacités de génération vidéo reste floue, le code fournit suffisamment d’indices pour spéculer sur son potentiel.

Actuellement, Google propose la création vidéo assistée par l’IA via Google Vids. Cependant, Google Vids fonctionne différemment d’un véritable système d’IA génératif. Il guide les utilisateurs à travers le processus de création, de la génération d’idées et de l’écriture de scripts au montage et à la génération de voix off. Une fonctionnalité de génération vidéo au sein de Gemini pourrait représenter une approche générative plus avancée.

Vers une génération vidéo plus avancée avec Gemini

Il est important de noter que les analyses de code peuvent fournir des indices sur les développements futurs, mais ne garantissent pas que ces fonctionnalités seront intégrées à la version publique de l’application. Des questions subsistent quant au fonctionnement concret de cette fonctionnalité : les utilisateurs pourront-ils fournir des invites textuelles ou d’autres types d’entrée pour générer des vidéos ? Quel niveau de contrôle auront-ils sur le contenu généré ?

L’intégration potentielle de la génération vidéo dans Gemini ouvre des perspectives intéressantes pour l’avenir de l’assistant d’IA de Google. Il faudra attendre les prochaines annonces de Google pour en savoir plus sur cette fonctionnalité et son fonctionnement.

Lire plus

Intelligence Artificielle

Meta : LlamaCon, une conférence dédiée à l’IA open source en avril !

par Yohann Poiron le 19 février 2025

Meta organisera LlamaCon, une nouvelle conférence dédiée aux développements de l’intelligence artificielle open source, le 29 avril 2025. Cet événement permettra aux développeurs de découvrir les dernières avancées de Meta en matière d’IA et de créer des applications et des produits innovants.

L’événement fait suite à « la croissance et l’élan sans précédent de notre collection de modèles et d’outils open source Llama », dans un article d’annonce. L’entreprise n’a pas donné de détails supplémentaires, tels que le lieu de la conférence ou le prix des billets, mais elle promet d’en donner davantage « dans les semaines à venir ».

LlamaCon : un événement centré sur l’IA open source :

LlamaCon, qui tire son nom du modèle d’IA open source de Meta, Llama, mettra en avant les progrès réalisés dans ce domaine. Meta promet de partager des informations et des outils pour aider les développeurs à exploiter le potentiel de l’IA open source.

La conférence annuelle de Meta, Meta Connect, se tiendra quant à elle du 17 au 18 septembre 2025. Cet événement sera l’occasion de découvrir les dernières innovations de Meta en matière de réalité virtuelle et augmentée, notamment avec des mises à jour de Meta Horizon. La conférence promet de « lever le voile sur la technologie de demain ».

Investissements massifs dans l’IA

Meta prévoit d’investir des milliards de dollars dans l’IA cette année et pourrait également lancer une nouvelle paire de lunettes connectées. Les lunettes connectées Ray-Ban Meta, développées en partenariat avec EssilorLuxottica, se sont vendues à 2 millions d’unités depuis leur lancement en octobre 2023.

« Cette année sera déterminante pour l’IA », a écrit Mark Zuckerberg. « En 2025, je m’attends à ce que Meta AI soit le principal assistant au service de plus d’un milliard de personnes, à ce que Llama 4 devienne le principal modèle de pointe et à ce que nous mettions en place un ingénieur en IA qui commencera à contribuer de plus en plus à nos efforts de R&D ».

Avec LlamaCon et Meta Connect, Meta réaffirme son engagement envers l’innovation et le développement de l’intelligence artificielle. Ces événements permettront aux développeurs et au grand public de découvrir les dernières avancées de Meta et d’explorer le potentiel de l’IA pour façonner le futur de la technologie.

Lire plus

Intelligence Artificielle

Thinking Machines Lab : l’IA plus humaine et accessible, le nouveau projet de Mira Murati

par Yohann Poiron le 19 février 2025

Mira Murati, ancienne directrice technique d’OpenAI, s’associe à plusieurs anciens cadres de la société pour lancer Thinking Machines Lab, une nouvelle startup spécialisée dans l’intelligence artificielle.

L’objectif de l’entreprise est de développer des modèles et des produits d’IA qui favorisent la collaboration entre l’homme et l’IA dans tous les domaines de travail. Elle souhaite « rendre les systèmes d’IA plus largement compris, personnalisables et généralement capables ».

Une équipe d’experts travaillant chez Thinking Machines Lab

L’équipe de direction de Thinking Machines Lab comprend des personnalités de renom dans le domaine de l’IA, notamment :

Mira Murati, ancienne CTO d’OpenAI, en tant que CEO
John Schulman, co-fondateur d’OpenAI, en tant que directeur scientifique
Barret Zoph, ancien vice-président de la recherche chez OpenAI, en tant que CTO
Lilian Weng, ancienne vice-présidente de la sécurité chez OpenAI

Plus d’une douzaine d’employés de la startup sont d’anciens employés d’OpenAI.

Thinking Machines Lab se distingue par sa philosophie axée sur la collaboration humain-IA. L’entreprise privilégie le développement de systèmes multimodaux capables de travailler en tandem avec les humains, plutôt que de se concentrer uniquement sur des systèmes d’IA entièrement autonomes.

L’entreprise souhaite démocratiser l’accès à l’IA en permettant à chacun de personnaliser et d’adapter les systèmes d’IA à ses propres besoins et objectifs.

Des ambitions élevées

La startup développe des modèles d’IA conçus pour exceller dans des domaines tels que la science et la programmation, dans le but de favoriser de nouvelles découvertes. Thinking Machines Lab s’engage également à publier régulièrement des articles de blog techniques, des publications scientifiques et du code afin de promouvoir la transparence et la collaboration au sein de la communauté de l’IA.

Avec son équipe d’experts et sa philosophie centrée sur la collaboration humain-IA, Thinking Machines Lab est une startup prometteuse qui pourrait jouer un rôle important dans l’évolution de l’intelligence artificielle. Il sera intéressant de suivre ses progrès et de découvrir les produits et modèles innovants qu’elle développera.

Lire plus

Intelligence Artificielle

AI Pin : HP rachète les actifs de Humane, le gadget disparaît

par Yohann Poiron le 19 février 2025

Humane, la startup derrière le AI Pin, un gadget d’intelligence artificielle portable controversé, annonce l’arrêt de la commercialisation du AI Pin et la fin de ses services. Les utilisateurs actuels verront leur appareil devenir inutilisable dans 10 jours.

Lancé il y a un an, le AI Pin était présenté comme un appareil révolutionnaire, capable d’exploiter la puissance de l’IA sans écran, en utilisant des commandes vocales et en projetant des informations sur la paume de la main. Malgré l’engouement initial, le gadget à 699 dollars, nécessitant un abonnement mensuel de 24 dollars, s’est avéré être un échec commercial. Les critiques ont pointé du doigt des fonctionnalités limitées et boguées, ruinant l’expérience utilisateur.

Dans le même temps, HP annonce l’acquisition de technologies d’intelligence artificielle clé auprès de Humane, incluant la plateforme Cosmos et un portefeuille de plus de 300 brevets et demandes de brevets. Cette opération, d’un montant de 116 millions de dollars, vise à transformer HP en une entreprise davantage axée sur l’expérience utilisateur.

L’acquisition permettra d’intégrer les ingénieurs, architectes et innovateurs de Humane au sein de l’organisation Technologie et Innovation de HP, avec la création d’un nouveau laboratoire d’IA baptisé HP IQ. Ce laboratoire se concentrera sur le développement d’un écosystème intelligent pour les produits et services HP, adapté au futur du travail.

HP souhaite exploiter l’IA pour créer une nouvelle génération d’appareils capables de gérer les requêtes d’IA localement et dans le cloud. L’objectif est d’offrir des expériences utilisateur plus fluides et intuitives, en intégrant l’IA dans tous les produits HP, des PC aux imprimantes intelligentes en passant par les salles de conférence connectées.

Une vision partagée pour le futur du travail sans le AI Pin

HP et Humane partagent une vision commune du futur du travail, où l’IA joue un rôle central dans l’amélioration de la productivité et de l’efficacité. L’expertise de Humane en matière de conception et d’intégration de technologies d’IA, combinée à l’envergure mondiale et à l’excellence opérationnelle de HP, permettra de créer des solutions innovantes pour les entreprises et les employés.

Cette acquisition stratégique permettra à HP de renforcer son expertise en matière d’IA et de développer des produits et services plus intelligents et performants. L’entreprise se positionne ainsi comme un acteur majeur dans la transformation du monde du travail à l’ère de l’intelligence artificielle.

Lire plus

Intelligence Artificielle

Grok 3 : Deep Search, Big Brain et jeux vidéo, l’IA de xAI se met à jour !

par Yohann Poiron le 19 février 2025

xAI, l’entreprise d’IA dirigée par Elon Musk, a annoncé Grok-3, son dernier modèle d’IA, lors d’une diffusion en direct. L’objectif est clair : combler rapidement les lacunes pratiques pour rendre son chatbot accessible au grand public, plutôt que de se contenter de discours sur la compréhension de l’univers.

Grok -3 se distingue par ses capacités de « raisonnement avancé », lui permettant de décomposer les instructions en tâches plus petites et de vérifier ses propres réponses avant de les fournir.

Grok -3 se décline en deux versions : Grok-3 et Grok-3 mini, cette dernière étant optimisée pour les environnements à faible puissance de calcul. Grok -3 offre des fonctionnalités telles que DeepSearch, Think et Big Brain. Selon les benchmarks de l’entreprise, Grok-3 surpasse GPT-4o d’OpenAI, Gemini, Claude et DeepSeek dans des tâches telles que le codage, les mathématiques et la résolution de problèmes scientifiques. Une version preview de Grok-3 a atteint 1 400 points sur le classement Chatbot Arena (LMSYS), dépassant Gemini 2.0 Flash Thinking et DeepSeek.

Elon Musk affirme que Grok-3 est une « IA qui recherche la vérité au maximum, même si cette vérité est parfois en contradiction avec le politiquement correct ». Les précédentes versions du chatbot xAI ont été critiquées pour avoir diffusé de la désinformation électorale et avoir eu moins de garde-fous sur la génération de texte en image.

https://t.co/hEfQ31gANQ

— xAI (@xai) February 18, 2025

Un défi de taille : l’accès et l’adoption

Malgré ses performances, Grok-3 devra relever le défi de l’adoption par le grand public. L’accès initial sera réservé aux abonnés X Premium+, actuellement le niveau d’abonnement X le plus élevé, au prix de 25,20 euros par mois ou 262,80 euros par an. Les utilisateurs éligibles auront accès aux fonctionnalités de Grok-3 telles que le raisonnement, DeepSearch, des limites d’utilisation plus élevées et un accès anticipé aux nouveaux outils.

Un abonnement SuperGrok distinct offrira un accès prioritaire à Grok-3 et des limites de génération d’images plus élevées, limité à l’application mobile Grok et au site Web Grok.com (pas encore disponible en Europe).

Rattraper les tendances

xAI semble vouloir rattraper son retard sur les tendances actuelles du marché des chatbots :

Raisonnement et réflexion améliorés : Grok-3 met l’accent sur le raisonnement et la réflexion, avec son mode Think, analogue aux modèles de la série o d’OpenAI. Les utilisateurs peuvent voir le cheminement de la pensée en temps réel, ce qui améliore les performances dans les domaines scientifiques, mathématiques et liés au codage. L’outil Big Brain de Grok-3 permet de gérer des scénarios plus complexes.
Agents d’IA : xAI se lance également dans la course aux agents d’IA avec DeepSearch, analogue à Deep Research de Google Gemini et aux produits concurrents de Perplexity et OpenAI. DeepSearch effectue une recherche sur le Web, compile un rapport complet et cite ses sources.
Interaction vocale : Un mode d’interaction vocale avec mémoire conversationnelle sera bientôt disponible sur Grok, analogue au mode vocal avancé de ChatGPT et Gemini Live de Google Gemini.

Trouver l’attrait pour le grand public

Malgré ses efforts, xAI a encore du chemin à parcourir pour rivaliser avec OpenAI et Google en matière d’agents d’IA. OpenAI propose Operator, un agent capable d’effectuer des tâches Web complexes, et un système de plugins ChatGPT qui intègre des plateformes comme Zapier, Expedia et Slack.

Google tire parti de son vaste écosystème d’applications et de produits, avec une intégration profonde avec Android et Workspace. DeepSeek a déjà été adopté par des marques comme Honor, tandis qu’Apple a intégré une pile d’intelligence ChatGPT sur des millions d’appareils et a conclu un accord avec Alibaba pour la Chine.

xAI a fait preuve d’ambition avec Grok-3, en proposant un chatbot performant avec des fonctionnalités innovantes. Le défi majeur reste de trouver l’attrait pour le grand public et de convaincre les entreprises d’adopter Grok-3. La stratégie de prix et la capacité de xAI à conclure des partenariats stratégiques seront déterminantes pour le succès de Grok-3.

Lire plus

Gemini Notebook : Google ajoute enfin les Collections pour mieux organiser vos recherches

Meta intègre son assistant Meta AI dans les messages privés de Threads

Cloudflare ouvre OAuth 2.0 à tous les développeurs et prépare l’arrivée des agents IA

Microsoft Edge va empêcher les captures d’écran de certains PDF protégés dans OneDrive et SharePoint

Galaxy Z Fold 8 Ultra : prise en main du pliable que son petit frère éclipse

Prise en main du Galaxy Z Fold 8 : le pliant format passeport qui vole la vedette à l’Ultra

Test de la HUAWEI Watch Fit 5 Pro : l’Apple Watch de ceux qui ne veulent pas d’Apple Watch

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

OnePlus 16 : lancement repoussé, nouveau design et batterie géante au programme

Honor officialise le lancement du Robot Phone, un smartphone à gimbal motorisé conçu avec ARRI

Google confirme une hausse des prix des Pixel 11 à cause du coût de la mémoire

Qualcomm préparerait un Snapdragon 8 Elite Gen 5 plus abordable pour les futurs flagships

Microsoft lance ses modèles MAI et réduit sa dépendance à OpenAI

Moonshot AI publie les poids de Kimi K3 : un modèle géant qui s’invite au cœur du débat sur l’IA ouverte

Claude Cowork : une faille de sécurité permettait à l’agent IA d’accéder aux fichiers d’un Mac hôte

Nvidia, Microsoft et Meta défendent l’IA ouverte face aux modèles propriétaires

Microsoft lance ses modèles MAI et réduit sa dépendance à OpenAI

Amazon prépare un service satellite pour smartphones afin de concurrencer Starlink dès 2028

Moonshot AI publie les poids de Kimi K3 : un modèle géant qui s’invite au cœur du débat sur l’IA ouverte

Boox prépare le Picco, un mini lecteur e-paper qui veut rivaliser avec les modèles MagSafe de Xteink

Google AI Studio simplifie le déploiement des applications avec des URL personnalisées

Claude Code ajoute un navigateur intégré pour consulter la documentation sans quitter l’IDE

Google Agents CLI : l’outil qui transforme Claude Code et Codex en experts des agents IA

Meta Pocket : créez des mini-jeux avec l’IA simplement en les décrivant

Comment réserver votre nom de profil WhatsApp ?

Claude Cowork : Le guide complet pour automatiser votre quotidien en 2026

Intel Core Ultra vs Apple Silicon : Quelle philosophie choisir pour votre prochain bureau compact ?

Comment arrêter le suivi des e-mails dans Gmail ?

Intelligence Artificielle

Microsoft lance ses modèles MAI et réduit sa dépendance à OpenAI

Moonshot AI publie les poids de Kimi K3 : un modèle géant qui s’invite au cœur du débat sur l’IA ouverte

Claude Cowork : une faille de sécurité permettait à l’agent IA d’accéder aux fichiers d’un Mac hôte

Nvidia, Microsoft et Meta défendent l’IA ouverte face aux modèles propriétaires

ChatGPT Voice peut désormais contrôler votre ordinateur grâce aux nouveaux agents IA d’OpenAI

Anthropic dévoile Claude Opus 5, un modèle plus performant et moins restrictif que Fable 5