fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

Grok-1.5 par xAI : L’IA qui repousse les frontières du possible

grok musk ia 1

La sphère de l’intelligence artificielle a été témoin d’une avancée notable avec l’annonce par xAI, la start-up d’intelligence artificielle d’Elon Musk, du développement de Grok-1.5. Cette nouvelle itération représente une évolution majeure par rapport à son prédécesseur, le modèle Grok-1, déjà réputé pour ses capacités de raisonnement avancées.

Le Grok-1.5, avec sa longueur de contexte étendue à 128 000 tokens, promet de repousser les limites de ce que l’on croyait possible dans le domaine de l’IA. Cette augmentation significative, par rapport aux 8 000 tokens de la précédente version, ouvre de nouvelles voies pour la compréhension et le traitement de données complexes à une échelle sans précédent.

Pour démontrer les capacités améliorées de Grok-1.5, xAI l’a soumis à une série de tests benchmarks reconnus dans le domaine. Sur le test MMLU, le modèle a impressionné avec un score de 81,3 % en configuration 5-shot, surpassant d’autres modèles de reno m tels que Mistral Large et Claude 3 Sonnet. Dans le domaine mathématique, avec le test MATH, Grok-1.5 a également démontré sa supériorité en obtenant un score de 50,6 % en 4-shot. Sur le test GSM8K, le modèle a réalisé une performance remarquable avec 90 % de réussite en 8-shot, et sur le test HumanEval, il a atteint 74,1 % sans aucune aide préalable.

Screen 2024 03 29 08.33.24 jpg

xAI met également en lumière les capacités de récupération de données du modèle avec le test NIAH (Needle in a Haystack), où Grok-1.5 a réalisé des résultats parfaits, témoignant de ses compétences exceptionnelles dans la localisation et l’extraction d’informations pertinentes au sein de vastes ensembles de données.

Bien que xAI ait choisi de ne pas révéler la taille exacte des paramètres de Grok-1.5, il est notoire que Grok-1 était basé sur une architecture de 314 milliards de paramètres, ce qui en faisait l’un des modèles open source les plus vastes disponibles. La décision d’offrir les poids du modèle et son architecture sous licence Apache 2.0 souligne l’engagement de l’entreprise envers la transparence et la collaboration dans le domaine de l’IA.

Une innovation majeure

Cette annonce intervient dans un contexte où la concurrence s’intensifie avec les récents lancements par Anthropic de ses modèles Claude 3, et les avancées d’OpenAI avec GPT-4.5 Turbo et les anticipations autour de GPT-5, sans oublier les progrès de Google avec son modèle Gemini 1.5 Pro.

Grok-1.5 se positionne ainsi comme une innovation majeure au cœur d’une industrie en rapide évolution. Son potentiel en matière de raisonnement et de traitement de données complexe suscite déjà un vif intérêt. Je suis impatient de voir comment ce modèle s’intégrera dans le paysage compétitif de l’intelligence artificielle et les applications révolutionnaires qu’il permettra.

Lire plus
Intelligence Artificielle

Qu’est-ce que DarwinAI, la nouvelle start-up d’Apple ?

darwin ai

Apple a discrètement acquis la startup canadienne d’intelligence artificielle DarwinAI au début de l’année, ajoutant des dizaines d’employés de la société à sa division d’intelligence artificielle.

Bloomberg News a rapporté cet achat discret jeudi, Apple n’ayant pas encore annoncé publiquement la nouvelle. La société a toutefois déclaré au média américain qu’elle « achetait de temps à autre de petites entreprises technologiques ».

L’un des principaux acteurs de la société basée dans l’Ontario, Alexander Wong, a rejoint Apple en tant que directeur de son groupe d’intelligence artificielle dans le cadre de l’opération. Il a contribué à la création de la startup et travaille comme chercheur en IA à l’université de Waterloo.

DarwinAI est la dernière d’une longue liste d’acquisitions analogues : Apple aurait acquis 32 startups spécialisées dans l’IA l’année dernière.

Qu’est-ce que DarwinAI ?

DarwinAI est surtout connue pour avoir développé une technologie d’IA capable d’inspecter visuellement des composants au cours du processus de fabrication. On dit qu’ils ont servi des clients dans une gamme d’industries.

Fondée en 2017, la société a déclaré que son objectif initial était de perturber « l’industrie de la fabrication électronique en améliorant l’efficacité de la production d’assemblage de cartes de circuits imprimés grâce à leur technologie révolutionnaire ».

En 2022, ils ont levé plus de 15 millions de dollars à travers 6 tours de financement. Elle a reçu l’appui de 12 investisseurs, dont Honeywell Ventures et Inovia Capital, entre autres sociétés de capital-risque.

Dans un communiqué de presse publié à la suite de l’annonce d’un cycle de financement en décembre 2022, l’un des cofondateurs a déclaré que la « transformation ne faisait que commencer », car ils prévoyaient de lever des fonds pour continuer à développer des fonctionnalités avancées.

Pourquoi Apple a-t-elle acquis DarwinAI ?

Ce n’est un secret pour personne qu’Apple est actuellement à la traîne par rapport à d’autres titans de l’industrie qui ont déjà franchi le pas dans le monde de l’IA.

Le fabricant de l’iPhone est en train de rattraper son retard, le directeur général Tim Cook ayant promis qu’Apple « innoverait » dans le domaine de l’IA cette année. L’iPhone pourrait bientôt être doté de l’intelligence artificielle (IA) Gemini de Google pour alimenter de nouvelles fonctionnalités, à la suite de discussions entre Apple et le géant de la recherche.

L’acquisition de Gemini s’inscrit probablement dans le cadre de l’attention portée par Apple à l’intelligence artificielle, afin de ne pas se laisser distancer par d’autres acteurs du secteur.

En septembre 2023, The Information a rapporté que la multinationale investissait des millions de dollars par jour dans l’intelligence artificielle, en travaillant sur plusieurs modèles d’IA au sein de plusieurs équipes.

Un travail considérable semble avoir été réalisé en arrière-plan chez Apple pour mettre l’IA au premier plan, avec une annonce attendue aux alentours du mois de juin, avant iOS 18 en septembre.

Lire plus
Intelligence Artificielle

Gemini vs Gemini Advanced : choisissez votre compagnon IA idéal

Google Gemini Advanced

Google propose désormais une version payante de son outil d’IA, Gemini Advanced. Google a réalisé des avancées considérables dans le domaine de l’intelligence artificielle, notamment avec l’introduction de son chatbot conversationnel innovant, baptisé Gemini. Ce chatbot représente une avancée technologique considérable, car il offre aux utilisateurs une expérience d’assistant virtuel transparente et interactive.

Conçu pour répondre à un large éventail de besoins, Gemini est disponible en deux versions principales : la version gratuite, appelée Google Gemini, et la version plus sophistiquée, basée sur un abonnement, connue sous le nom de Gemini Advanced.

Pour bien comprendre le fonctionnement de Gemini, il est important de se pencher sur les caractéristiques et les capacités qui distinguent ces deux versions.

Gemini : votre compagnon IA polyvalent

Google Gemini, accessible gratuitement, intègre divers produits Google et brille dans plusieurs domaines :

  • Requêtes informationnelles : Gemini peut puiser dans Google Recherche pour répondre à des questions quotidiennes variées.
  • Support linguistique : Il comprend et répond dans plusieurs langues, facilitant la communication.
  • Assistance créative : Que ce soit pour écrire un poème, brainstormer des idées ou rédiger un e-mail, Gemini stimule votre créativité.
  • Gestion simplifiée des tâches : Il peut définir des rappels, créer des listes ou effectuer des actions basiques dans les applications Google supportées.

Gemini Advanced : élever l’interaction IA au niveau supérieur

Gemini Advanced enrichit l’expérience avec des fonctionnalités avancées, intégrées au service d’abonnement Google One, notamment grâce au modèle AI Ultra 1.0 de pointe de Google.

Voici ce qui distingue Gemini Advanced :

  • Raisonnement et résolution de problèmes complexes : Capable de gérer des problèmes plus ardus et d’analyser des scénarios complexes.
  • Compétences en codage : Que vous ayez besoin d’aide pour générer des extraits de code ou pour déboguer, Gemini Advanced est là.
  • Assistant de recherche approfondie : Il va au-delà de la simple recherche, capable de digérer des matériaux étendus et de synthétiser des informations.
  • Créativité améliorée : Il devient votre collaborateur créatif, que ce soit pour rédiger des scripts, des intrigues détaillées ou générer du contenu marketing.

Choisir le bon Gemini

Le choix entre Gemini et Gemini Advanced dépend de vos besoins :

  • Utilisateurs occasionnels : Pour des connaissances générales et une assistance créative légère, Google Gemini offre une expérience exceptionnelle.
  • Utilisateurs exigeants, professionnels et créatifs : Avec ses capacités avancées de résolution de problèmes, de codage et de recherche approfondie, Gemini Advanced est idéal.

Les deux versions de Gemini sont dynamiques, évoluant grâce à leur intégration avec Google Recherche. Pour ceux qui privilégient un accès à un ensemble d’outils IA plus étendu et puissant, investir dans Gemini Advanced est judicieux. Cette version est conçue pour répondre à vos besoins actuels et s’adapter à leur croissance, garantissant que Gemini Advanced reste un outil de pointe.

Lire plus
Intelligence Artificielle

Open-Sora : une alternative open source à l’IA texte-vidéo Sora d’OpenAI

Sora AI video 01

Après la présentation de Sora, le puissant modèle d’IA texte-vidéo d’OpenAI, en début d’année, une nouvelle alternative à Sora a vu le jour sous la forme d’Open-Sora. Open-Sora se présente comme une plateforme communautaire offrant une alternative aux modèles propriétaires tels que Sora d’OpenAI.

Son objectif est de rendre la production vidéo accessible à tous. Avec Open-Sora, vous pouvez transformer vos idées créatives en vidéos détaillées simplement en tapant ce que vous imaginez. Bien qu’il soit encore en cours de perfectionnement, le potentiel d’Open-Sora est immense.

Nous présentons Open-Sora, une initiative visant à produire efficacement des vidéos de haute qualité et à rendre le modèle, les outils et les contenus accessibles à tous. En adoptant les principes de l’open source, Open-Sora ne démocratise pas seulement l’accès aux techniques avancées de génération de vidéos, mais offre également une plateforme rationalisée et conviviale qui simplifie les complexités de la production vidéo. Avec Open-Sora, nous voulons inspirer l’innovation, la créativité et l’inclusivité dans le domaine de la création de contenu.

L’alternative de Sora d’OpenAI

L’épine dorsale d’Open-Sora est un puissant système de traitement des données vidéo. Ce système est conçu pour transformer rapidement et efficacement du texte en vidéo. Il utilise des méthodes avancées pour former l’IA et créer des contenus à la fois complexes et attrayants. Ce processus vise à rendre la production vidéo plus simple et plus abordable.

Pour commencer à utiliser Open-Sora, vous devrez configurer certains outils techniques. Il s’agit notamment de Conda, Pip, Python et Git. Si vous êtes familier avec ces paquets, vous êtes prêt à commencer. Une fois que tout est installé, la conception d’Open-Sora permet à des personnes ayant différents niveaux d’expérience en matière d’édition vidéo d’explorer leur côté créatif. Regardez le tutoriel vidéo ci-dessous, créé avec l’aide de

Modèle d’IA texte-vidéo

Pour l’instant, Open-Sora peut vous aider à créer de courts clips vidéo d’une résolution de 512 × 512 pixels. Il s’agit d’un grand pas en avant pour les médias générés par l’IA. L’approche utilisée ne se concentre plus sur des images individuelles, mais sur la création de séquences vidéo fluides. Cela signifie que les vidéos que vous réalisez s’enchaînent naturellement, au lieu de ressembler à une série d’images collées les unes aux autres.

Lorsque vous vous plongerez dans Open-Sora, vous prendrez le temps d’en apprendre davantage sur sa structure et sur la manière d’ajuster ses paramètres. Vous serez en mesure de l’utiliser au maximum de son potentiel. Open-Sora étant un logiciel libre, vous ne vous contentez pas d’utiliser l’outil, vous pouvez également contribuer à l’améliorer. Votre contribution peut influencer l’avenir de la technologie de production vidéo.

Caractéristiques d’Open-Sora

  • Open-Sora est une alternative open source à Sora d’OpenAI pour la génération de texte à partir de la vidéo.
  • Le projet n’en est qu’à ses débuts, avec des bugs et des erreurs potentielles.
  • Il vise à démocratiser la production de vidéos en étant gratuit et accessible à tous.
  • Open-Sora peut générer des vidéos détaillées à partir de prompts spécifiques.
  • Le modèle simplifie la production vidéo et encourage la créativité.
  • Il comporte un pipeline pour le traitement des données vidéo, y compris l’entraînement avec accélération et l’inférence.
  • Le modèle est conçu pour réduire les coûts et améliorer l’efficacité de la génération de vidéos.
  • Open-Sora prend actuellement en charge les vidéos de courte durée avec une résolution de 512 × 512 pixels.
  • Le processus d’apprentissage comprend la transition d’une image à un modèle de diffusion vidéo.
  • L’installation nécessite certains prérequis techniques tels que Conda, Pip, Python et Git.
  • Les utilisateurs sont encouragés à apprendre la structure et la configuration du projet pour une utilisation optimale.

Open-Sora ouvre la voie au contenu généré par l’IA. Il offre un moyen simple et abordable de réaliser des vidéos, encourageant ainsi une culture de l’innovation et de la créativité. Open-Sora n’est pas seulement un outil, c’est aussi l’occasion de rejoindre une communauté qui repousse les limites du possible en matière de création de contenu vidéo. Que vous soyez un producteur vidéo chevronné ou quelqu’un qui commence à explorer ce domaine, Open-Sora vous invite à faire partie de l’avenir passionnant de la création vidéo.

Lire plus
Intelligence Artificielle

Zoom Workplace : Révolutionnez votre travail d’équipe avec l’IA

Zz1iODRlMmYxMmU2YmQxMWVlODQxNzk2

Zoom a récemment dévoilé sa dernière innovation dans le monde de la collaboration et de la productivité : une toute nouvelle plateforme unifiée dotée d’outils d’intelligence artificielle. Zoom Workplace propose un espace unique pour la collaboration en équipe, l’interaction avec les clients, et l’amélioration de la productivité grâce à un compagnon IA.

Cette plateforme réunit tout l’écosystème Zoom — réunions, messagerie d’équipe, et interactions téléphoniques — sous un même toit, et peut être intégrée de manière transparente aux technologies existantes.

Le Zoom AI Companion offre des capacités de résumé de réunion que nous attendons désormais des plateformes de collaboration au travail intégrant l’IA, mais il propose également plusieurs autres fonctionnalités intéressantes. Le AI Companion aide également les employés à se préparer pour les réunions en fournissant des informations issues de réunions passées, des actions à entreprendre, et des notes sur les échanges pertinents entre les participants, économisant ainsi le temps qui serait autrement consacré à la mise à jour manuelle.

Le compagnon peut également fixer automatiquement des rappels pour les tâches importantes mentionnées lors des réunions et offre une coopération avec des tiers pour s’intégrer à Microsoft 365 et Google Workspace.

Le AI Companion de Zoom sera inclus dans la plateforme sans coût supplémentaire, et peut fournir des résumés de réunion pour 36 langues en aperçu, aidant les grandes entreprises à travers plusieurs régions et fuseaux horaires à communiquer de la manière la plus efficace possible.

Le AI Companion sera également disponible pour Zoom Phone, fournissant des appels téléphoniques et des messages SMS avec les mêmes capacités de résumé proposées pour les réunions.

Zoom Workplace

La plateforme Zoom Workplace offre également des choix de thèmes hautement personnalisables, ainsi que la possibilité pour les hôtes de réunion de définir un arrière-plan virtuel unique pour établir le thème et le ton de la réunion avant son début.

La vue améliorée multi-orateurs et la priorisation de sujet adaptative maintiennent le projecteur sur les orateurs actifs, et l’ajustement de l’image assisté par IA peut ajuster la qualité visuelle du visage d’un utilisateur dans une faible luminosité.

La nouvelle plateforme unifiée comprend également des fonctionnalités pour les organisations basées au bureau avec l’onglet Workspaces permettant aux utilisateurs de réserver des salles de conférence ou des espaces de concentration, avec des capacités de guidage et des outils de gestion des visiteurs intégrés.

Services Business de Zoom

La plateforme Workplace inclut également des services business, visant à aborder l’interaction client à travers les ventes, le marketing, et le service client dans un seul espace.

Workplace peut être configuré pour inclure WhatsApp et l’e-mail entrant pour aider les équipes de soin client à mieux répondre aux besoins et préoccupations de leurs clients, avec des considérations de régulation des données de l’UE rencontrées par la capacité de stocker des données importantes dans le centre de données de Zoom dans l’UE.

Pour ceux dans le domaine de la gestion de la relation client, Zoom Contact Center offre aux superviseurs d’équipe la possibilité de voir les engagements en direct de leurs équipes, avec des transcriptions, des résumés et le sentiment des clients livrés en temps réel.

Contact Center et Zoom Phone peuvent être intégrés de manière transparente avec PCI Pal pour garantir que les détails des paiements et les données importantes sont sécurisés, et que les besoins de conformité sont immédiatement satisfaits.

Lire plus
Intelligence Artificielle

Découvrez les capacités étendues de ChatGPT avec la mise à jour de mars 2024 !

file XZnTNHcF7J8ugzisaGrw3DZP

OpenAI a publié une nouvelle mise à jour pour ChatGPT, introduisant plusieurs fonctionnalités visant à améliorer la collaboration, la créativité et l’expérience globale de l’utilisateur.

Les principales mises à jour de ChatGPT pour mars 2024 sont les suivantes :

  • Historique des versions pour les instances de ChatGPT : Une nouvelle fonctionnalité permet aux utilisateurs de suivre les changements et de revenir aux précédentes versions de leurs configurations ChatGPT personnalisées, facilitant ainsi l’expérimentation et la stabilité.
  • Des aperçus détaillés dans le GPT Store : Avant de sélectionner une instance ChatGPT, les utilisateurs peuvent maintenant voir plus d’informations, y compris les évaluations, le nombre de conversations et les catégories.
  • Amélioration des options de génération d’images : Les utilisateurs ont accès à davantage de suggestions et peuvent spécifier des ratios d’aspect pour les images générées, recevant plusieurs versions pour comparaison et sélection.

La dernière mise à jour d’OpenAI a été spécialement conçue pour transformer la façon dont vous et votre équipe collaborez et créez, avec des mises à jour des espaces de travail partagés. Vous pouvez désormais inviter les membres de votre équipe à rejoindre vos instances ChatGPT, ce qui facilite la gestion de l’accès aux données. C’est particulièrement important lorsque vous traitez des informations sensibles ou que vous devez adapter l’IA aux besoins spécifiques de votre équipe.

Mais ce n’est pas tout. Vous est-il déjà arrivé d’apporter des modifications à un outil et de souhaiter revenir en arrière ? La nouvelle fonction de suivi des versions est votre filet de sécurité. Elle vous permet de garder un œil sur les modifications que vous avez apportées à votre configuration ChatGPT et, si nécessaire, de revenir à une version antérieure. Cela signifie que vous pouvez expérimenter en toute confiance, en sachant que vous pouvez toujours revenir à une configuration stable si les choses ne se passent pas comme prévu.

Nouvelle mise à jour de ChatGPT pour mars 2024

Choisir la bonne instance ChatGPT pour votre projet est devenu plus facile. Le GPT Store offre maintenant des aperçus détaillés, avec des évaluations et des catégories d’utilisateurs. Cette richesse d’informations à portée de main signifie que vous pouvez prendre des décisions plus éclairées sur l’instance qui répondra le mieux à vos besoins.

Et pour ceux d’entre vous qui s’adonnent à la génération d’images, préparez-vous à être impressionnés. La mise à jour vous apporte une plus grande sélection de suggestions et de rapports d’aspect personnalisables. Que vous conceviez des visuels pour différentes plateformes ou que vous visiez une vision créative spécifique, ces nouvelles options vous aideront à produire des images qui feront mouche à chaque fois.

Cette dernière mise à jour d’OpenAI a pour but de vous donner, à vous et à votre équipe, davantage de contrôle et de flexibilité. Elle est conçue pour rendre votre expérience avec ChatGPT plus fluide, plus intuitive et, en fin de compte, plus productive. Que vous soyez seul ou que vous fassiez partie d’un grand groupe, ces nouvelles fonctionnalités sont là pour soutenir votre travail et vous aider à exploiter tout le potentiel de l’IA.

Espaces de travail ChatGPT

Qu’est-ce que cela signifie pour vous ? Si vous aimez la collaboration, les espaces de travail partagés vont changer la donne. Vous aurez le pouvoir de gérer l’accès de votre équipe aux ressources d’IA comme jamais auparavant. Pour les innovateurs et les expérimentateurs, le suivi des versions offre la liberté d’explorer différentes configurations sans craindre de se perdre. Et si vous souhaitez faire des choix éclairés, les aperçus du magasin GPT seront votre guide pour sélectionner l’instance ChatGPT parfaite pour votre projet.

Mais l’aspect le plus excitant de cette mise à jour est peut-être la génération d’images améliorée. C’est un domaine où votre créativité peut vraiment s’épanouir, avec davantage d’options pour adapter vos visuels à vos spécifications exactes. Que vous créiez du contenu pour les réseaux sociaux, que vous conceviez des graphiques pour une présentation ou que vous exploriez simplement les possibilités de l’art généré par l’IA, les nouvelles fonctionnalités vous aideront à donner vie à votre vision.

En vous plongeant dans ces mises à jour, vous constaterez que votre interaction avec ChatGPT n’est pas seulement plus productive, mais aussi plus satisfaisante. La plateforme évolue pour répondre aux demandes d’une base d’utilisateurs diversifiée, des professionnels férus de technologie aux esprits créatifs à la recherche de leur prochaine muse. Avec les espaces de travail partagés, le suivi des versions, les aperçus du GPT Store et la génération d’images améliorée, OpenAI s’assure que ChatGPT reste à la pointe des outils d’IA, prêt à soutenir vos projets les plus ambitieux.

 

Lire plus
Intelligence Artificielle

Microsoft met l’accent sur Copilot en dévoilant ses Surface Pro 10 et Laptop 6

M365 hero blog image

Microsoft a dévoilé une série de produits intégrés à l’IA, dont les nouveaux Surface Pro 10 et Surface Laptop 6, avec son chatbot, Copilot, au centre de l’attention. Le géant de la technologie a intensifié son jeu dans le domaine de l’IA, avec Copilot au premier plan de ses innovations.

Lors du livestream de jeudi, Microsoft a mis en avant les fonctionnalités de Copilot, notamment ses capacités accrues en matière d’exécution des tâches du système Windows pour ses utilisateurs.

Melissa Grant, directrice senior de Microsoft pour Windows Enterprise, a déclaré : « Windows 11 et Windows 365 promettent une nouvelle ère de productivité grâce à l’IA ». « Notre objectif est de permettre aux employés de travailler de manière plus efficace et créative et de tirer le meilleur parti de leur temps productif. »

Sous Windows 11, les utilisateurs pourront basculer entre les modes « Travail » et « Web » à l’aide de la bascule Copilot. Le bouton « Travail » permet d’intégrer les fonctionnalités Microsoft 365 de Copilot dans l’interface Windows.

Grant a ajouté que l’objectif de cette nouvelle technologie est de permettre à Windows de « fournir une technologie qui vous met sur la voie d’une organisation centrée sur l’IA ».

Microsoft investit dans les PC cloud

Microsoft investit également dans les PC sur le cloud fournis depuis Windows 365, en les utilisant comme plateforme pour Copilot. L’application utilisée pour accéder à ces PC cloud est appelée à juste titre « Windows app ». Microsoft indique que depuis son lancement en avant-première lors du Microsoft Ignite 2023 en novembre, l’application Windows a accumulé plus de 3 millions d’heures d’utilisation active.

La société basée à Washington est optimiste quant au fait que son compagnon IA Copilot permettra de gagner du temps et de réduire le stress sur le lieu de travail.

Les premiers « AI PC » de Microsoft

La Surface Pro 10 est censée offrir les fonctionnalités les plus avancées de Copilot dans un design portable pour les travailleurs mobiles, tandis que le Surface Laptop 6 combine la puissance de calcul typique d’un PC de bureau avec la commodité d’un ordinateur portable léger.

Les utilisateurs auront la possibilité de personnaliser l’appareil pour eux-mêmes, d’optimiser les performances énergétiques pour prolonger la durée de vie de la batterie, et de recevoir des suggestions d’amélioration des performances et des conseils de dépannage de la part de Copilot.

Les améliorations de l’IA pour Windows 365 contribueront également à renforcer la sécurité des appareils et de l’organisation grâce à l’authentification unique, au chiffrement des PC dans le cloud et aux capacités d’accès de confiance zéro.

La Pro 10 utilise désormais une unité de traitement neuronal (NPU) qui est le moteur de toutes les dernières fonctionnalités intégrées de Copilot. Cela permet de libérer de la capacité sur le processeur principal pour traiter les tâches importantes.

L’appareil est également doté d’une technologie d’encrage avancée, qui aiderait à organiser les notes en documents structurés à l’aide de Copilot. Il s’accompagne de suggestions Copilot conçues pour affiner le workflow et améliorer la productivité.

La Pro 10 offrirait le plus grand champ de vision d’une tablette, avec un angle vidéo HD de 140 degrés et un cadrage automatique piloté par l’IA.

Lire plus
Intelligence Artificielle

Les performances du LLM d’IA Grok-1 d’Elon Musks testées

1i1Y Z7kfwP3uqt 8gqFzNA

L’équipe d’IA d’Elon Musk a récemment publié Grok-1, un grand modèle de langage comportant 314 milliards de paramètres. Ce modèle de mélange d’experts, qui n’a pas encore été quantifié, a été mis à l’épreuve dans divers domaines, notamment le codage, la logique, le raisonnement et la censure.

L’un des aspects les plus impressionnants de Grok-1 est sa capacité à générer du code rapidement et avec précision. Bien qu’il n’ait pas réussi à produire un jeu de Snake entièrement fonctionnel en Python, les capacités de codage du modèle sont tout de même remarquables. Cette fonction pourrait s’avérer extrêmement utile pour les développeurs qui cherchent à rationaliser leurs processus de codage.

Grok -1 a également excellé dans les tâches de logique et de raisonnement, en résolvant correctement plusieurs problèmes qui lui ont été présentés.

Cela démontre la compréhension avancée du modèle et met en évidence sa potentielle utilité dans les domaines qui nécessitent une prise de décision complexe, telle que la stratégie d’entreprise et la recherche scientifique. Il est intéressant de noter que Grok-1 a démontré qu’il n’était pas censuré en fournissant des informations sur un sujet sensible lorsqu’on le lui demandait. Cette approche unique du traitement des contenus controversés pourrait avoir un impact significatif sur la manière dont les systèmes d’IA gèrent les informations sensibles à l’avenir.

Les performances et les réponses de Grok-1 testées

Outre ses capacités de codage et de raisonnement, Grok-1 a démontré ses prouesses mathématiques en résolvant correctement des problèmes mathématiques simples et complexes. Cette polyvalence souligne le potentiel du modèle en tant qu’outil pour un large éventail d’applications mathématiques, de l’arithmétique de base au calcul avancé. Cependant, Grok-1 n’est pas sans limites.

Le modèle a éprouvé des difficultés dans les tâches de prédiction, telles que l’estimation du nombre de mots dans sa propre réponse. Cela suggère que la capacité de Grok-1 à prévoir les résultats peut encore être améliorée, ce qui est un aspect crucial des performances de l’IA. Découvrez le processus d’essai complet réalisé par Matthew Berman, qui a testé les réponses et les capacités du nouveau modèle de langage large Grok-1 non censuré publié par Elon Musk et son équipe de développement de l’IA.

Grok -1 a également obtenu des résultats mitigés lorsqu’il s’agissait de problèmes de mots et de puzzles logiques. S’il a fourni des réponses correctes dans certains cas, il a également commis des erreurs dans d’autres. Cette incohérence indique que le modèle doit être affiné dans ce domaine. En revanche, Grok-1 a excellé dans la génération de JSON bien formatés pour un scénario donné, démontrant ainsi sa capacité à créer des données structurées. Cette capacité est essentielle pour de nombreuses applications nécessitant une organisation des données, telles que la gestion de bases de données et le développement d’API.

L’une des révélations les plus intéressantes de l’évaluation est sans doute la capacité de Grok-1 à traiter des informations en temps réel provenant de sources telles que X (anciennement Twitter). Cette fonctionnalité pourrait s’avérer extrêmement précieuse pour les applications qui doivent traiter et répondre à des flux de données en direct, comme les outils de surveillance des réseaux sociaux et les plateformes d’analyse en temps réel.

Orientations futures de Grok-1

Bien que Grok-1 ait déjà démontré des capacités impressionnantes, il existe encore plusieurs domaines dans lesquels le modèle pourrait être amélioré et étendu :

  • Quantification : Tester une version quantifiée de Grok-1 pourrait conduire à des versions plus efficaces et plus spécialisées du modèle, adaptées à des tâches spécifiques.
  • Performances de codage : Améliorer la capacité de Grok-1 à générer un code entièrement fonctionnel pour des projets complexes, tels que des jeux et des applications.
  • Précision des prédictions : Affiner la capacité du modèle à prévoir les résultats et à estimer les valeurs, telles que la longueur de ses propres réponses.
  • Cohérence dans la résolution des problèmes : Améliorer les performances de Grok-1 dans les problèmes de mots et les énigmes logiques afin de fournir des réponses plus précises et plus fiables.

Alors que l’équipe d’Elon Musk chargée de l’IA continue de développer et d’affiner Grok-1, il sera passionnant de voir comment ce puissant modèle de langage évolue et quelles nouvelles applications il pourra permettre à l’avenir. Grâce à ses performances impressionnantes en matière de codage, de logique, de raisonnement et de traitement des données en temps réel, Grok-1 a le potentiel de révolutionner la façon dont nous interagissons avec la technologie de l’IA et dont nous l’utilisons.

Lire plus
Intelligence Artificielle

GPT-5 : La prochaine révolution IA attendue pour l’été 2024

9995d3b0 27b9 4d0e ab0f 45b1ca13

GPT-5, le prochain Large Language Model (LLM) d’OpenAI, est en préparation et devrait être lancé dans les mois à venir, ont indiqué des personnes proches du dossier à Business Insider.

Deux sources anonymes ont indiqué à la publication que GPT-5 pourrait être lancé au cours de l’été et qu’OpenAI envoie actuellement des démonstrations de la technologie, ainsi que des mises à jour du chatbot ChatGPT qui l’accompagne, à ses entreprises clientes pour qu’elles les testent.

Un PDG qui a pu assister à une démonstration de GPT-5 présentant des cas d’utilisation spécifiques à son entreprise a été très impressionné par ce qu’OpenAI a présenté jusqu’à présent. « C’est vraiment bien, c’est même nettement mieux », a-t-il déclaré à Business Insider.

Les présentations internes de la marque mettent également l’accent sur des fonctionnalités inédites de GPT-5. L’une d’entre elles est un agent d’intelligence artificielle capable d’exécuter des tâches indépendamment de l’assistance humaine.

Alors que les entreprises partenaires testent GPT-5 en interne, des sources affirment que OpenAI est toujours en train de former le futur LLM. Ce calendrier déterminera en fin de compte la date de sortie du modèle, car il doit encore subir des tests de sécurité, y compris le « red teaming ». Il s’agit d’un processus de cybersécurité au cours duquel les employés d’OpenAI et d’autres tiers tentent d’infiltrer la technologie sous l’apparence d’un mauvais acteur afin de découvrir des vulnérabilités avant son lancement public.

Pas encore de date concrète

Ce processus pouvant durer des mois, OpenAI n’a pas fixé de date concrète pour la sortie de GPT-5, et les prévisions actuelles pourraient changer.

La dernière mise à jour officielle fournie par OpenAI au sujet de GPT-5 date d’avril 2023, dans laquelle il était dit qu’il n’y avait « aucun plan » de formation dans un avenir immédiat. Un mois seulement après la sortie de GPT-4, le PDG et cofondateur Sam Altman a étouffé les rumeurs concernant GPT-5, déclarant à l’époque que ces rumeurs étaient « stupides ». Les premières rumeurs faisaient également état d’une version incrémentale de GPT-4.5, qui a persisté jusqu’à la fin de l’année 2023.

Mais depuis lors, il a été rapporté que la formation avait déjà été achevée en 2023 et que le lancement aurait lieu en 2024.

GPT-5 sera probablement destiné aux entreprises clientes d’OpenAI, qui représentent la majorité des revenus de l’entreprise. Avec le lancement du nouveau modèle, l’entreprise pourrait établir un système de niveaux similaire aux niveaux LLM de Google Gemini, avec différentes versions du modèle servant différents objectifs et clients. Actuellement, les modèles GPT-4 et GPT-4 Turbo sont connus pour utiliser le produit payant ChatGPT Plus, tandis que le modèle GPT-3.5 utilise le chatbot ChatGPT original, toujours gratuit.

GPT-4.5 Turbo avant ?

Tout au long de l’année dernière, des utilisateurs ont signalé la « paresse » et le « nivellement par le bas » de GPT-4 en raison d’hallucinations, de commentaires insolents ou d’échecs des requêtes du modèle linguistique. De nombreuses explications ont été avancées pour expliquer ces phénomènes, notamment le fait que GPT-4 devienne plus intelligent et plus efficace au fur et à mesure qu’il est mieux entraîné, et que OpenAI travaille avec des ressources GPU limitées. Certains ont également émis l’hypothèse que OpenAI avait entraînée de nouveaux LLM inédits en même temps que les LLM actuels, ce qui a eu pour effet de surcharger ses systèmes.

En décembre 2023, des observateurs ont appelé les hypothétiques LLM GPT-4.5 et GPT-4.5 Turbo, après avoir découvert des niveaux de prix et des informations sur les capacités multimodales avancées. Interrogé sur la validité de la fuite sur X (anciennement Twitter), Altman a répondu : « Non » : « Non ».

Lire plus
Intelligence Artificielle

Apple se lance dans l’IA multimodale : découverte de MM1

apple ai bbo

Apple semble progressivement marquer son territoire dans l’univers de l’intelligence artificielle (IA), malgré une approche relativement discrète par rapport à d’autres géants technologiques comme Google, Microsoft et OpenAI.

Leur dernier développement, un Multimodal Large Language Model (MLLM) nommé MM1, indique un intérêt croissant pour l’IA générative, capable de traiter à la fois du texte et des images. Cette initiative s’aligne sur les fonctionnalités des modèles existants tels que Gemini de Google ou Llama 2 de Meta.

L’intérêt d’Apple pour l’IA ne s’arrête pas là. Des discussions sont en cours avec Google pour potentiellement intégrer le moteur IA Gemini dans iOS 18, enrichissant ainsi les fonctionnalités d’IA générative de l’iPhone. Parallèlement, les capacités de MM1 pourraient être exploitées différemment, avec des spéculations suggérant son utilisation comme alternative au moteur de recherche Google classique ou pour développer des outils d’IA générative fonctionnant directement sur les appareils.

La récente acquisition de la startup canadienne DarwinAI par Apple renforce cette orientation, la spécialisation de DarwinAI dans le développement de systèmes IA plus compacts et rapides étant cruciale pour le traitement sur appareil, ce qui pourrait aligner avec les visions de Ruslan Salakhutdinov, ancien responsable de la recherche en IA chez Apple.

Malgré l’absence d’un calendrier précis pour le lancement de ces produits IA, Tim Cook a souligné lors de la réunion annuelle des actionnaires que l’IA joue déjà un rôle en coulisse dans les produits Apple, avec des annonces attendues plus tard cette année concernant des fonctionnalités d’IA plus explicites.

Lire plus
Intelligence Artificielle

Révolution Fitbit : Google prépare le lancement d’un chatbot innovant

Screenshot 2024 03 19 153904 1.p

Google prévoit d’intégrer ce qu’il appelle un « Personal AI » à l’ensemble de son portefeuille de produits, tirant parti des progrès de l’IA générative et du développement de modèles spécifiquement pour le secteur de la santé. Lors de son récent événement Checkup 2024, Google a proposé une mise à jour importante concernant les laboratoires Fitbit, nous donnant une idée du moment où l’assistant alimenté par l’IA de Fitbit tant attendu sera lancé.

La société a exprimé son désir de permettre aux utilisateurs de mieux comprendre les données de bien-être collectées par les capteurs sur leur corps, que ce soit via des montres connectées ou des smartphones.

Le géant de la technologie a été discret sur le lancement officiel de son chatbot Fitbit, se contentant de dire qu’il sortira plus tard cette année. De plus, il connaîtra une sortie limitée, disponible uniquement pour le petit groupe d’utilisateurs Android actuellement inscrits au programme sur l’application Fitbit.

Pourquoi suis-je si enthousiaste à ce sujet ? Le chatbot est un assistant de fitness qui répondra à toutes vos questions brûlantes sur vos données personnelles Fitbit de manière décontractée. Il est censé reproduire ce que c’est que de parler à un coach personnel. La technologie de Google est censée fournir des « aperçus personnalisés » sur l’évolution de votre parcours de fitness et vous coacher sur les choses que vous pouvez faire pour vous améliorer.

Par exemple, les utilisateurs peuvent lui poser des questions telles que : « Y a-t-il un lien entre mes habitudes de sommeil et mes statistiques d’activité quotidienne ? ». Dans de tels scénarios, l’IA examinera le journal de sommeil et d’activité et fournira aux utilisateurs les insights nécessaires, comme leur expliquer comment ils dorment mieux les jours où ils sont plus actifs, basé sur leurs données de minutes actives quotidiennes.

De précieux insights

L’IA de Fitbit créera également des graphiques et « aidera [les gens] à mieux comprendre leurs propres données ». Par exemple, les réponses du chatbot afficheront les minutes de zone active de Fitbit aux côtés d’un score de sommeil moyen. À terme, il sera capable d’établir des liens entre davantage de biomarqueurs tels que l’activité cardiaque, l’intensité de l’exercice, la variation du rythme cardiaque, et plus encore.

Google indique que ce sera une version affinée du modèle Gemini de l’entreprise, qui fonctionne déjà nativement sur des appareils tels que Google Pixel 8 Pro et la série Samsung Galaxy S24. L’objectif ultime est de créer un « coach personnel sur demande » capable de fournir non seulement des insights précieux, mais aussi des conseils pouvant aider les utilisateurs à apporter des changements et des améliorations là où c’est nécessaire.

Dans un proche avenir, ces expériences de santé pilotées par l’IA seront disponibles depuis les smartphones Pixel, les wearables Fitbit et Pixel Watch, les smartphones Pixel et les écouteurs Pixel.

Un regard vers le futur

Bien sûr, il y a une mise en garde standard ici. « Ce n’est pas destiné à diagnostiquer, traiter, atténuer, guérir ou prévenir une maladie, une blessure ou une condition », déclare Florence Tang, directrice des produits chez Google. Au lieu de cela, il est simplement destiné à aider les utilisateurs à atteindre leurs objectifs de fitness avec plus d’informations et de conseils que jamais auparavant, grâce à l’IA.

Si vous êtes intéressé à essayer le chatbot, vous pouvez rejoindre Fitbit Labs à tout moment ; cependant, vous aurez besoin d’un abonnement à Fitbit Premium en premier lieu.

Outre le chatbot, Google a également parlé de la mise à niveau de son moteur de recherche pour inclure des informations de santé détaillées sur certaines conditions. « Des images et des diagrammes de sources [en ligne] de haute qualité » seront présents dans les résultats de recherche permettant aux gens de mieux comprendre les symptômes qu’ils peuvent ressentir. Les nouvelles ressources visuelles seront déployées mondialement dans la recherche Google sur mobile dans les mois à venir. Aucune information n’a été donnée quant à l’arrivée d’une fonctionnalité analogue sur le bureau.

Lire plus
Intelligence Artificielle

Sam Altman prédit un tournant avec GPT-5 : Impact et innovations

a chat with chat GPT b0720c02d3

Sam Altman, PDG d’OpenAI, a récemment fait part de son point de vue sur le prochain modèle ChatGPT-5 et son potentiel impact sur divers aspects de notre vie. Au cours de son intervention, Altman a mis en évidence plusieurs points clés concernant le développement, les attentes et les implications de cette IA conversationnelle avancée.

En outre, Sam Altman a adopté une approche très honnête en suggérant que GPT-4, le dernier modèle d’IA de l’équipe, n’est pas aussi impressionnant que le monde le laisse entendre.

Dans un entretien avec Lex Friedman, publié lundi 18 mars, il a déclaré : « Je pense que c’est un peu nul », lorsqu’on l’a interrogé sur GPT-4 et ses capacités. Le patron d’OpenAI, âgé de 38 ans, a poursuivi en déclarant : « Je pense que c’est une chose étonnante, mais par rapport à ce que nous devons faire et à ce que je crois que nous ferons, à l’époque de GPT-3, les gens disaient “oh c’est incroyable, c’est une merveille de la technologie” et c’est vrai, c’était vrai ».

« Mais aujourd’hui, nous avons le GPT-4 et quand on regarde le GPT-3, on se dit que c’est d’une horreur inimaginable ».

L’un des aspects les plus intéressants de ChatGPT-5 est sa performance attendue. Altman prédit que le nouveau modèle dépassera les attentes actuelles, soulignant la nécessité d’adopter de nouvelles perspectives, car il influencera probablement de nombreux domaines de la vie quotidienne et du monde des affaires. Cela suggère que nos interactions avec les machines pourraient bientôt devenir plus naturelles et intuitives que jamais.

  • ChatGPT-5 devrait dépasser les attentes actuelles en matière de performances, rendant les conversations avec les machines plus naturelles et plus intuitives.
  • L’objectif de OpenAI est de construire une intelligence générale artificielle (AGI) capable de comprendre, d’apprendre et d’appliquer des connaissances comme les humains.
  • L’impact économique de GPT-5 pourrait rendre obsolètes les modèles commerciaux traditionnels, ce qui obligerait les entreprises à s’adapter rapidement.
  • La résolution de l’AGI pourrait intrinsèquement permettre de relever des défis dans divers secteurs, ce qui déboucherait sur des solutions innovantes.
  • L’augmentation de la puissance de calcul et de l’infrastructure est nécessaire pour soutenir le développement de modèles d’IA avancés.
  • Le rythme des progrès de l’IA devrait s’accélérer rapidement dans un avenir proche, ce qui conduira à des avancées révolutionnaires.

Construire intelligence artificielle générale

L’objectif ultime de OpenAI est de construire une intelligence générale artificielle (AGI), un système d’IA capable de comprendre, d’apprendre et d’appliquer des connaissances d’une manière indiscernable de l’intelligence humaine. Altman estime qu’avec des ressources informatiques suffisantes, il est possible de créer une IA qui surpasse les capacités humaines. Si elle se concrétise, elle pourrait conduire à des avancées révolutionnaires dans divers domaines, tels que la médecine et les sciences de l’environnement.

Toutefois, le potentiel impact économique de GPT-5 ne peut être ignoré. Altman prévient que la sous-estimation des améliorations apportées par le modèle pourrait être une erreur coûteuse pour les entreprises. À mesure que l’IA continue d’évoluer, les modèles d’entreprise traditionnels pourraient devenir obsolètes, ce qui obligerait les entreprises à s’adapter rapidement pour rester compétitives sur un marché dominé par l’IA.

Altman se concentre actuellement sur l’IA, ce qui montre qu’il est convaincu que la résolution des problèmes liés à l’AGI permettra de relever des défis dans d’autres secteurs d’activité. En concentrant ses efforts sur le développement de modèles d’IA avancés tels que ChatGPT-5, OpenAI espère trouver des solutions à des problèmes complexes couvrant plusieurs secteurs, ce qui pourrait déboucher sur des innovations inimaginables.

OpenAI travaille sur une infrastructure

Pour soutenir le développement des modèles d’IA de la prochaine génération, il faut de plus en plus de puissance de calcul. Altman travaille à l’innovation d’une infrastructure mondiale de l’IA, laissant entrevoir l’importance de l’informatique en tant que « monnaie » à l’avenir. Alors que l’IA continue de progresser, l’infrastructure qui la soutient doit également évoluer pour suivre le rythme des avancées rapides.

Les employés de OpenAI estiment que les progrès de l’IA au cours de l’année écoulée seront considérés comme lents par rapport à ce qui est attendu dans un avenir proche. Cela indique que nous sommes à l’aube d’une période de croissance et de développement accélérés dans le domaine de l’intelligence artificielle.

Si nous nous tournons vers l’avenir, il est clair que ChatGPT-5 et d’autres modèles d’IA avancés joueront un rôle important dans le façonnement de notre monde. Qu’il s’agisse de transformer les interactions quotidiennes avec la technologie ou de révolutionner des secteurs entiers, le potentiel impact de ces systèmes est immense. Alors que les entreprises et les particuliers se préparent à cette nouvelle ère d’innovation axée sur l’IA, il est essentiel de rester informé et de s’adapter aux changements qui nous attendent.

Lire plus
Intelligence Artificielle

NVIDIA présente la plateforme Earth-2 pour améliorer les prévisions climatiques

cab5958f 8a66 4045 a380 6394f9cc1a2c

NVIDIA a présenté aujourd’hui sa plateforme cloud Earth-2 lors de l’événement GTC 2024 à San Jose, en Californie, visant à faire progresser les prévisions du changement climatique mondial grâce à des simulations alimentées par l’IA. Selon VentureBeat, la plateforme, qui a été mentionnée pour la première fois en 2021, est désormais pleinement opérationnelle.

Lors de son discours, Jensen Huang, PDG de NVIDIA, a souligné le rôle de Earth-2 dans la lutte contre les catastrophes climatiques fréquentes telles que les sécheresses, les ouragans et les inondations. Selon Huang, la plateforme Earth-2 offre des API qui permettent la simulation et la visualisation à grande échelle des données météorologiques et climatiques, fournissant ainsi un outil pour mieux se préparer et atténuer les effets des événements météorologiques extrêmes.

Earth -2 s’appuie sur une combinaison de logiciels microservices CUDA-X de NVIDIA et de modèles d’IA, notamment le modèle d’IA génératif CorrDiff. Cette intégration permet des simulations à la fois plus rapides et plus économes en énergie que les modèles numériques traditionnels. Rev Lebaredian, vice-président de NVIDIA chargé de la simulation, a souligné l’impact économique des conditions météorologiques extrêmes, qui entraînent des pertes de 140 milliards de dollars par an, et la nécessité de disposer de simulations détaillées à l’échelle du kilomètre pour relever efficacement ce défi.

L’une des premières organisations à utiliser Earth-2 est l’administration météorologique centrale de Taïwan, qui entend utiliser les modèles de la plateforme pour améliorer la prévision des typhons et la planification des évacuations. En outre, les capacités d’Earth-2 sont étendues grâce à l’intégration avec NVIDIA Omniverse, ce qui permet aux utilisateurs de développer des workflows en 3D qui intègrent des données météorologiques réelles dans leurs environnements de jumeaux numériques.

The Weather Company, une entité spécialisée dans les prévisions et les informations météorologiques, a annoncé son intention d’intégrer les API d’Earth-2 pour améliorer ses produits et services de modélisation météorologiques. Cette collaboration vise à fournir des informations météorologiques plus précises aux entreprises clientes et à améliorer la compréhension et la simulation globales des impacts météorologiques.

Une énorme attente

Avec Earth-2, NVIDIA offre non seulement un outil sophistiqué pour les prévisions climatiques et météorologiques, mais contribue également à l’effort plus large de lutte contre le changement climatique. La capacité de la plateforme à fournir des simulations et des prévisions à haute résolution en temps opportun représente une avancée significative dans la préparation aux catastrophes et l’analyse environnementale.

Lors de la conférence GTC 2024, NVIDIA a également présenté d’autres innovations telles que la plateforme logicielle NIM pour un déploiement rationalisé de l’IA, et des avancées dans le domaine de la robotique humanoïde avec le projet GR00T.

Lire plus
Intelligence Artificielle

NVIDIA lance NIM pour simplifier le déploiement de modèles d’IA

nim inference microservices

Lors de sa conférence GTC aujourd’hui, NVIDIA a dévoilé NIM, une plateforme logicielle révolutionnaire conçue pour intégrer de manière transparente des modèles d’IA personnalisés et pré-entraînés dans des environnements de production.

Outre un certain nombre d’annonces faites aujourd’hui lors de la conférence GTC de NVIDIA, NIM exploite l’expertise de NVIDIA en matière d’inférence et d’optimisation des modèles d’IA, offrant ainsi une approche simplifiée aux développeurs. En fusionnant les modèles d’IA avec un moteur d’inférence optimisé et en les encapsulant dans des conteneurs accessibles en tant que microservices, NIM réduit considérablement le temps de déploiement.

Ce qui aurait traditionnellement pris des mois peut désormais être accompli rapidement, sans qu’il soit nécessaire de disposer d’une grande expertise interne en matière d’IA.

Cette plateforme innovante prend en charge les modèles d’entités notables telles que NVIDIA, A121 et Getty Images, ainsi que les modèles ouverts de géants de la technologie tels que Google et Meta. La collaboration de NVIDIA avec Amazon, Google et Microsoft vise à intégrer les microservices de NIM dans les principaux services de cloud, améliorant ainsi l’accessibilité pour les développeurs.

NVIDIA NIM

L’épine dorsale de NIM : Les moteurs d’inférence de NVIDIA

Au cœur de NIM se trouve le serveur d’inférence Triton, ainsi que TensorRT et TensorRT-LLM, soulignant l’engagement de NVIDIA à fournir une base solide pour les applications d’IA. La plateforme comprend également des microservices spécialisés, tels que Riva pour les ajustements de la parole et de la traduction, cuOpt pour les optimisations de routage, et le modèle Earth-2 pour les simulations météorologiques et climatiques.

Manuvir Das, responsable de l’informatique d’entreprise chez NVIDIA, a souligné l’efficacité et la qualité de niveau entreprise qu’apporte NIM, permettant aux développeurs de se concentrer sur la création d’applications d’entreprise sans avoir à se préoccuper de la gestion des modèles.

NIM témoigne de la vision de NVIDIA qui consiste à transformer les entreprises en entités pilotées par l’IA, équipées d’une suite de microservices d’IA conteneurisés. Avec le soutien de géants de l’industrie et d’un écosystème de partenaires, le NIM de NVIDIA est prêt à révolutionner la façon dont les modèles d’IA sont déployés et utilisés dans divers secteurs.

Jensen Huang, PDG de NVIDIA, a souligné le potentiel de transformation du NIM, imaginant un avenir où chaque entreprise tirera parti de l’IA pour améliorer ses opérations et sa capacité d’innovation.

Lire plus
Intelligence Artificielle

NVIDIA dévoile le projet GR00T : Une révolution pour les humanoïdes du futur

file nOjNc1Vz2yChu119mEvWVszH

Lors de la conférence GTC, tenue au centre de congrès San Jose McEnery, NVIDIA a marqué les esprits. L’ambition de NVIDIA d’être leader dans le domaine de l’IA s’étend au-delà de sa célèbre technologie des puces, puisque le PDG Jensen Huang exprime son enthousiasme pour le développement de modèles de base pour les robots humanoïdes, selon un récent rapport de TechCrunch.

Le géant technologique tire parti de son influence dans le domaine du matériel d’IA pour lancer des innovations dans le domaine de la robotique, comme en témoigne l’annonce du projet GR00T, une intelligence artificielle multimodale destinée à animer les humanoïdes du futur.

Cette initiative souligne l’évolution stratégique de NVIDIA dans la sphère concurrentielle de la robotique humanoïde, laissant entrevoir son potentiel impact sur les futures applications de l’IA. Ce projet s’appuie sur un modèle de fondation polyvalent permettant aux robots humanoïdes de traiter des entrées telles que le texte, la parole, les vidéos ou même des démonstrations en direct pour réaliser des actions générales spécifiques.

Le projet GR00T apparaît comme la réponse de NVIDIA à l’intérêt croissant pour les robots humanoïdes, proposant un modèle de fondation à usage général visant à soutenir un large éventail d’entreprises dans ce secteur, telles que Agility Robotics, Boston Dynamics et XPENG Robotics. Cette initiative témoigne de l’engagement de NVIDIA à faciliter les avancées dans le domaine de la robotique, en proposant une plateforme qui promet d’accélérer le développement de diverses applications, de l’automatisation industrielle à l’assistance humaine quotidienne.

Project GR00T Humanoid Image jpg

Selon TechCrunch, Jonathan Hurst d’Agility Robotics et Geordie Rose de Sanctuary AI ont salué l’initiative, soulignant le potentiel de transformation des robots centrés sur l’homme tels que Digit pour remodeler le travail et relever les principaux défis sociétaux. L’approche de partenariat de NVIDIA, axée sur la collaboration et l’innovation partagée, ouvre la voie à l’évolution de l’IA incarnée.

Une merveille dans un monde en pleine expansion

Parallèlement au projet GR00T, NVIDIA a présenté le Jetson Thor, une merveille informatique conçue pour les applications de robotique humanoïde. Ce nouveau matériel, doté de l’architecture Blackwell de NVIDIA, souligne les efforts de l’entreprise pour repousser les limites de l’IA et des performances robotiques, facilitant ainsi le développement de robots plus performants et plus polyvalents.

Isaac Robotics GenAI Expansion I jpg

NVIDIA a également dévoilé deux programmes supplémentaires : Isaac Manipulator et Isaac Perceptor, qui visent à faire progresser la dextérité robotique et le traitement de la vision. Ces initiatives reflètent la stratégie globale de NVIDIA visant à influencer une gamme plus large de fonctionnalités robotiques, de l’automatisation de la fabrication à la navigation autonome.

Des attentes considérables

Les implications du projet GR00T sont vastes, promettant une nouvelle ère de robots capables de comprendre et d’interagir avec le monde réel de manière naturelle et intuitive. Évidemment, le lancement du projet GR00T soulève des attentes considérables. Ce système n’est pas seulement une prouesse technologique ; il représente également une avancée majeure vers la réalisation d’humanoïdes autonomes capables d’effectuer des tâches complexes dans un large éventail d’environnements. Avec les plans d’expansion de NVIDIA pour rendre cette technologie accessible à un plus grand nombre de développeurs, l’avenir des humanoïdes semble prometteur.

L’implication d’OpenAI et la collaboration avec des startups spécialisées dans l’IA incarnée soulignent l’importance croissante de ces technologies avancées. Alors que le projet GR00T reste en accès anticipé, l’industrie attend avec impatience de découvrir comment cette technologie révolutionnaire continuera à évoluer et à façonner le futur de la robotique.

Lire plus