fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

Vers une révolution IA: Apple flirte avec l’IA de Google, Gemini

Gemini SS.width 1300 3

Dans une ère où la guerre de l’IA façonne le futur des technologies mobiles, Apple pourrait bien être sur le point de franchir un cap décisif.

Dans une récente révélation de Bloomberg, Apple semble prête à sceller un partenariat stratégique avec Google, marquant un tournant majeur dans l’univers de la technologie mobile. L’objet de ce partenariat ? Intégrer la technologie d’intelligence artificielle Gemini de Google dans les fonctionnalités de l’iPhone, une démarche qui promet de redéfinir l’expérience utilisateur iOS.

Apple, reconnu pour son écosystème fermé et son innovation autonome, ouvre ainsi un nouveau chapitre en envisageant d’adopter une technologie externe pour booster ses capacités en IA. La firme de Cupertino, jusqu’ici plutôt discrète sur le front de l’intelligence artificielle générative, se trouve sous la pression croissante du marché, où des géants comme OpenAI et Microsoft démontrent des avancées significatives.

L’objectif d’Apple ? Intégrer des fonctionnalités alimentées par l’IA dans les mises à jour d’iOS, en envisageant même un partenariat avec OpenAI pour exploiter les modèles GPT. Ces développements sont d’autant plus cruciaux que Tim Cook, le PDG d’Apple, a promis l’intégration de fonctionnalités d’IA générative « plus tard cette année », soulignant l’importance stratégique de l’IA pour l’avenir de l’entreprise.

Cependant, cette orientation vers des technologies d’IA tierces suggère que les efforts internes d’Apple n’ont pas atteint les objectifs escomptés. Bien que des outils propulsés par l’IA soient prévus pour l’iPhone, notamment dans la prochaine mise à jour iOS 18, la collaboration avec Google pourrait offrir une palette de cas d’utilisation inédite, allant de la création d’images à l’assistance rédactionnelle.

Une approche peu conventionnelle

Google, malgré les récents défis rencontrés avec Gemini, notamment les erreurs dans la génération d’images, reste un acteur majeur dans l’intégration de l’IA dans les appareils mobiles, comme en témoigne sa collaboration avec Samsung pour les fonctionnalités IA du Galaxy S24.

Cette potentielle alliance entre Apple et Google pourrait donc non seulement transformer l’expérience utilisateur sur iPhone, mais aussi redéfinir les standards de l’innovation technologique dans l’industrie mobile. Reste à voir comment ces géants de la tech concrétiseront cette ambitieuse vision, marquant potentiellement le début d’une nouvelle ère pour l’intelligence artificielle sur les appareils mobiles.

Ce partenariat envisagé, qui reste à finaliser en termes d’accord et d’implémentation, pourrait non seulement renforcer les capacités de l’iPhone, mais aussi ouvrir la porte à une collaboration plus large, englobant peut-être d’autres acteurs clés comme OpenAI. Les détails définitifs de ce partenariat sont attendus avec impatience, notamment lors de la prochaine Worldwide Developers Conference (WWDC), traditionnellement prévue début juin. Cette évolution marque-t-elle le début d’une nouvelle ère pour Apple dans le domaine de l’IA ? Seul l’avenir nous le dira.

Lire plus
Intelligence Artificielle

Grok de xAI : l’IA open source qui défie les géants technologiques

What is Grok AI and how to use i

Dans un mouvement considéré comme révolutionnaire pour la communauté de l’intelligence artificielle, xAI, l’entreprise dirigée par Elon Musk, a récemment franchi une étape significative dans le monde de l’intelligence artificielle en rendant public le code de base de son modèle IA Grok.

Ce modèle, qui n’inclut pas le code d’entraînement, est présenté comme un modèle à « 314 milliards de paramètres Mixture-of-Expert » sur la plateforme GitHub, marquant ainsi un jalon important dans la transparence et la collaboration dans le domaine de l’IA.

Dans une communication officielle, xAI a précisé que Grok-1, bien qu’impressionnant par sa taille, n’a pas été optimisé pour des applications spécifiques comme les conversations automatisées. L’entreprise souligne que le modèle a été développé sur une infrastructure « personnalisée », sans toutefois entrer dans les détails techniques. Ce flou autour de sa construction suscite curiosité et spéculation dans la communauté des développeurs.

xAI avait précisé en novembre 2023 que le LLM Grok avait été « développé au cours des quatre derniers mois », visant des applications telles que la génération de code, l’écriture créative, et la réponse aux questions.

Sous la licence Apache 2.0, Grok ouvre des perspectives fascinantes pour l’exploitation commerciale, permettant aux entreprises et aux développeurs d’intégrer cette technologie de pointe dans leurs propres projets. Cette démarche s’inscrit dans une tendance croissante où des entités telles que Meta et Google ont également partagé certaines de leurs créations en intelligence artificielle, stimulant ainsi l’innovation et la collaboration sectorielle.

Un souhait de Elon Musk

La mise à disposition de Grok intervient après que Musk ait annoncé sur X, la plateforme sociale précédemment connue sous le nom de Twitter, l’intention de xAI de libérer ce modèle. Initialement lancé sous forme de chatbot pour les utilisateurs Premium+ du réseau social X, Grok a la capacité d’interagir avec certaines données de la plateforme, une fonctionnalité qui, à noter, n’est pas présente dans la version open source.

Cette initiative pourrait transformer le paysage de l’IA, offrant un nouvel outil potentiellement révolutionnaire aux chercheurs et aux entreprises. Cependant, elle soulève également des questions sur l’avenir de l’intégration de l’IA dans nos vies, spécialement en termes de personnalisation et de sécurité des données.

Depuis l’acquisition de Twitter (maintenant X) par Musk, le code derrière ses algorithmes a été publié, et Musk a fréquemment critiqué les entreprises qui ne partagent pas leurs modèles d’IA, y compris OpenAI, qu’il a aidé à fonder et qu’il poursuit maintenant en justice.

Un excellent feedback à receuillir

Les entreprises ont adopté la stratégie de rendre leurs modèles partiellement ou totalement open source pour bénéficier du feedback de la communauté scientifique, améliorant ainsi leurs produits. Bien que de nombreux modèles de fondation d’IA soient entièrement open source, les modèles les plus utilisés restent souvent à source fermée ou proposent une licence open source limitée.

Lire plus
Intelligence Artificielle

La Lumitool F20 permet de graver l’IA directement à partir de Midjourney

pc

La gravure à domicile devient de plus en plus populaire, tant pour les amateurs que pour les petites entreprises. Et, l’arrivée de la Lumitool F20 va certainement propulser la gravure dans la stratosphère grâce à l’intégration de l’intelligence artificielle (IA). La Lumitool F20 est actuellement lancée sur Kickstarter et a déjà atteint son modeste objectif.

L’appareil est livré avec une application « alimentée par Midjourney AI design ». Les utilisateurs peuvent saisir des messages sur l’application et graver directement les images générées sur plus de 100 matériaux. Midjourney peut produire des résultats très impressionnants si vous savez l’utiliser, mais l’accès à la génération d’IA coûte un abonnement de 99 dollars par an.

Les Super Early Birds peuvent mettre la main sur le Lumitool pour 1 459 euros, soit 900 euros de moins que le prix de vente, en soutenant le niveau le plus bas sur Kickstarter. Ce prix comprend également un an d’accès à l’outil de génération d’IA. Cependant, les donateurs doivent d’abord vérifier les frais d’expédition, qui commencent à 72 euros.

Quelles sont les caractéristiques de la Lumitool F20 ?

La Lumitool F20 est un laser à fibre de 20W qui peut graver jusqu’à 1,5 mm dans le métal et 3 mm dans la pierre. Il prétend également être 10x plus rapide que les autres modèles comparables, avec une vitesse de 7000 mm/s. C’est nettement plus rapide que la LaserPecker LP2, par exemple, qui couvre 36 000 mm/min (600 mm/s).

Elle est également compacte et portable et peut être utilisée pour graver de grandes surfaces verticales ou des objets courbes ou inclinés. L’appareil utilise un double positionnement de la lumière infrarouge pour des niveaux élevés de précision. Elle offre également une zone de travail de base de 110 x 110 mm, avec la possibilité de l’étendre à 150 x 150 mm.

3 1 0ae9df9f 60d7 4574 8710 91bb11f08ff0 scaled

Le graveur a une résolution de 8 k qui lui permet d’atteindre un niveau de précision supérieur à celui de nombreux concurrents, avec une granularité de 0,001 mm.

Lumitool a également déclaré qu’elle travaillait à l’intégration de Lightburn dans son application. Lightburn est un logiciel populaire pour la création de dessins de gravure, et l’application de Lumitool peut importer les fichiers DXF créés par Lightburn.

La livraison devrait commencer en avril 2024.

Lire plus
Intelligence Artificielle

WWDC 2024 : Siri prêt à évoluer avec de nouvelles capacités d’IA ?

ea5b01ac b399 456d bfa3 06141bd3020f

Lorsque Siri a été présenté pour la première fois lors de l’annonce de l’iPhone 4s en 2011, les utilisateurs d’iPhone étaient ravis de disposer de leur propre assistant numérique virtuel et les possibilités semblaient infinies. Mais aujourd’hui, Siri est plus frustrant qu’autre chose, surtout lorsqu’on le compare à Google Assistant. Chaque année, les personnes investies dans l’écosystème Apple espèrent qu’Apple a amélioré Siri au-delà de l’ajout d’une nouvelle voix ou d’un nouvel accent. 2024 pourrait être cette année-là.

Le blogueur yeux1122 affirme que lors de la WWDC 2024, qui devrait avoir lieu en juin prochain, Apple annoncera de nouvelles capacités d’IA générative pour Siri, basées sur le modèle Ajax interne d’Apple.

Nous devrions également voir « plus de personnalisation et de conversations naturelles » ajoutées à Siri. Ce que cela signifie exactement pour l’utilisateur lambda de Siri n’est pas clair et cela ne semble pas résoudre les principaux problèmes dont se plaignent les utilisateurs de Siri.

La chose que les utilisateurs de Siri souhaitent peut-être le plus est la possibilité d’obtenir une réponse directe de Siri, et non une réponse du type « J’ai trouvé votre réponse sur le web. Ouvrez votre téléphone pour la lire ». D’autres problèmes ? Parfois, Siri ne vous entend pas correctement ; une rumeur de mise à niveau du microphone de l’assistant numérique devrait permettre de résoudre ce problème. D’autres fois, lorsque Siri a la bonne question, il vous donne une réponse incorrecte.

Selon yeux1122, une autre capacité d’IA que nous pourrions voir annoncée pour Siri permettrait à un utilisateur de commencer une conversation avec Siri sur son iPhone et de la poursuivre sur un iPad ou un Mac.

Beaucoup de rumeurs

Reste à savoir si toutes ces rumeurs d’ajouts, d’améliorations et de mises à jour de l’IA peuvent faire de Siri un meilleur assistant numérique. Personnellement, je serais heureux si Siri était capable de répondre à davantage de questions en donnant la bonne réponse en une seule phrase. D’autres tâches impliquant des alarmes, des minuteurs et d’autres réglages ne semblent pas poser de problème à Siri.

Qu’Apple parvienne ou non à remettre de l’ordre dans son assistant numérique virtuel, nous attendons avec impatience la WWDC 2024 pour voir comment Apple compte appliquer l’IA à Siri. D’ailleurs, yeux 1122 n’est pas la première fuite sur les réseaux sociaux à affirmer qu’Apple annoncera des fonctionnalités d’IA pour Siri lors de la WWDC. En novembre, @Tech_Reve a dit la même chose, mais a précisé que la version améliorée de Siri serait disponible sur l’iPhone 16 et les modèles ultérieurs.

Lire plus
Intelligence Artificielle

Apple réinvente l’animation photo avec Keyframer, un outil d’IA

5a7ac815 41c0 445c ad71 0224a368766d

Apple semble être à l’aube d’une révolution dans l’univers de l’intelligence artificielle avec le développement d’un outil baptisé Apple Keyframer. Selon les informations de 9to5Mac, des chercheurs affiliés à la marque à la pomme croquée ont publié un document exposant une méthode permettant de manipuler et d’animer des images fixes à partir de simples instructions textuelles.

Ce prometteur outil pourrait transformer n’importe quelle photo en une brève animation, en se contentant de décrire le résultat souhaité via une commande textuelle.

Imaginez la possibilité d’animer la scène capturée depuis votre fenêtre, où les feuilles des arbres se mettraient à danser sous l’effet du vent ou les voitures passeraient en mouvement, et ce, uniquement en tapant une commande telle que « faire bouger les feuilles comme si c’était venteux ». Cette prouesse serait réalisable grâce à Apple Keyframer, qui interprète les commandes en langage naturel pour animer la partie spécifiée de votre photo.

Ce terme de « keyframe », ou image clé en français, n’est pas étranger aux utilisateurs d’Apple puisqu’il est déjà intégré à la fonctionnalité Live Photos. Cette dernière permet de parcourir un GIF de photo live pour choisir l’image clé qui servira de photo fixe.

Apple a souvent été perçu comme tardif à adopter les innovations en matière d’IA, mais cette stratégie de patience semble porter ses fruits, notamment avec son incursion réussie dans la réalité mixte via le Vision Pro. Cela renforce l’espoir de voir débarquer d’autres innovations, telles qu’un iPhone pliable.

Rien d’officiel à ce jour

L’outil Keyframer, s’il voit le jour, représenterait une avancée majeure en démocratisant les outils d’animation de base pour les utilisateurs d’iPhone, qui pourraient ne pas savoir par où commencer avec l’animation. Cela marque une orientation claire d’Apple vers l’amélioration de l’expérience utilisateur avec des outils IA, se distinguant des propositions concurrentes telles que celles d’OpenAI, Microsoft et Google.

Il est rafraîchissant de constater que l’engagement d’Apple dans l’intelligence artificielle ne se limite pas à la création d’un énième chatbot IA, mais s’oriente vers des outils offrant des fonctionnalités nouvelles et uniques pour les produits iOS et macOS. Bien que ce projet soit encore à ses débuts, l’enthousiasme est palpable à l’idée de pouvoir créer des clips amusants de moments mémorables avec de simples instructions textuelles.

Quant à la disponibilité de Keyframer, aucune date de sortie n’a été annoncée pour l’instant. Néanmoins, le fait qu’Apple partage des détails à ce stade suggère que le lancement pourrait ne pas être loin, soulignant l’intérêt de l’entreprise pour ce projet innovant. Apple, contrairement à Google, a tendance à mener à terme les projets qu’elle dévoile, ce qui augmente l’anticipation autour de Keyframer.

Lire plus
Intelligence Artificielle

Microsoft révolutionne la sécurité IT avec Copilot for Security

copilotsecurity

Microsoft a récemment dévoilé son intention de renforcer la sécurité des entreprises du monde entier avec le lancement général de sa plateforme Copilot for Security.

Animée par l’intelligence artificielle, cette nouvelle solution sera intégrée dans l’ensemble du portefeuille de protection de Microsoft, aidant les professionnels de la sécurité à maintenir une protection efficace contre les menaces les plus récentes.

Utilisant GPT-4 d’OpenAI ainsi que son propre modèle spécifique à la sécurité, Copilot for Security se présente essentiellement comme un chatbot permettant aux professionnels de la cybersécurité d’obtenir les dernières informations sur les incidents de sécurité, des résumés de menaces, etc. Copilot est conçu pour prendre en charge une grande partie de ce fastidieux travail, grâce à des compétences que les intervenants humains n’ont parfois tout simplement pas.

Selon Andrew Conway, vice-président du marketing de la sécurité chez Microsoft, « la sécurité est actuellement le cas d’utilisation le plus sérieux pour l’IA ». Les organisations, souvent désavantagées face aux acteurs malveillants, peuvent maintenant tirer parti de l’IA pour prendre l’ascendant et améliorer leur posture de sécurité.

Copilot vise à permettre aux défenseurs de réagir beaucoup plus rapidement aux attaques, réduisant ainsi les risques auxquels leur organisation est confrontée et améliorant les résultats en matière de sécurité.

L’IA au cœur de l’expérience

Microsoft indique que Copilot s’appuie sur une quantité massive de données et d’intelligence en matière de menaces, traitant plus de 78 trillions de signaux de sécurité chaque jour. Associé à de Large Language Model, il est désormais capable de fournir des insights personnalisés et de guider les actions à suivre face à une large gamme de menaces et d’attaques.

Copilot sera intégré à l’ensemble de l’infrastructure de sécurité de Microsoft, et pas seulement dans Defender, mais aussi dans Entra, Purview et Intune (en version preview), aidant les professionnels de la sécurité à bénéficier d’une expérience unifiée sur leurs plateformes.

Une récente étude menée par l’entreprise a révélé que les analystes de sécurité expérimentés étaient 22 % plus rapides en utilisant Copilot, et presque tous (97 %) ont exprimé le souhait de continuer à utiliser la plateforme pour les mêmes tâches à l’avenir.

MicrosoftTeams image 49 jpg

Simplifier le processus de sécurité

Conway a présenté plusieurs démonstrations de l’utilisation de Copilot for Security une fois intégré à Microsoft Defender XDR, y compris pour le triage d’une attaque, la spécification du type d’attaque ou de menace, et la génération d’un résumé d’incident permettant une réponse beaucoup plus rapide.

Il souligne également que cette innovation simplifie considérablement les processus de sécurité, comme le dépôt d’un ticket via les systèmes internes de l’entreprise, ce qui pourrait prendre beaucoup de temps, s’avérant potentiellement désastreux lors de la réponse à une attaque.

En outre, il mentionne l’existence d’un grand nombre de postes vacants dans l’industrie de la sécurité actuellement, Copilot ayant la capacité d’apporter des compétences et de former les employés moins expérimentés, leur donnant l’avantage d’apprendre sur le tas et de se préparer mieux à des tâches telles que l’analyse de scripts obscurcis.

Microsoft Copilot for Security sera disponible à l’achat à partir du 1er avril 2024. Cependant, contrairement à Copilot pour Microsoft 365, qui propose un tarif mensuel fixe, Microsoft facturera aux entreprises 4 dollars par heure d’utilisation selon un modèle de consommation, à compter du 1er avril.

Lire plus
Intelligence Artificielle

OpenAI franchit un cap avec Figure 01 : Synthèse vocale et compréhension environnementale

Figure 01 robot speech and visio

Imaginez un monde dans lequel des robots humanoïdes dotés d’une intelligence artificielle pourraient non seulement vous parler, mais aussi comprendre et interagir avec l’environnement qui les entoure, comme le ferait une personne. OpenAI, un laboratoire de recherche en IA de premier plan qui investit dans le développement de Figure 01, a fait un grand pas en avant avec sa dernière mise à jour de la technologie de synthèse vocale. Cette mise à jour représente un grand pas en avant dans la manière dont les systèmes d’IA comprennent le monde et s’y engagent, en les rapprochant d’une interaction semblable à celle des humains.

Cette nouvelle technologie ChatGPT a été déployée sur le robot humanoïde Figure 01, qui a désormais la remarquable capacité de reconnaître les objets qui l’entourent. Imaginez : une pomme rouge est posée sur une table et Figure 01 peut l’identifier avec précision. Cette capacité est essentielle pour que l’IA puisse interagir de manière significative avec son environnement.

Mais ce n’est pas tout. L’IA peut désormais répondre à des demandes en montrant qu’elle comprend ce dont vous avez besoin. Si vous avez faim et que vous demandez quelque chose à manger, Figure 01 peut voir que la pomme est de la nourriture et vous la proposer. Cela montre que l’IA ne se contente pas de reconnaître des objets, mais qu’elle comprend également leur utilisation dans notre vie quotidienne. Regardez la démonstration du robot humanoïde Figure 01 ci-dessous, qui a été amélioré avec ChatGPT Vision et ChatGPT Speech, nous donnant un aperçu d’un avenir qui approche à grands pas.

Le raisonnement de l’IA sur l’environnement s’est également beaucoup amélioré. Elle peut prédire ce qui se passera ensuite en fonction de ce qui se passe actuellement. Par exemple, elle sait qu’une fois la vaisselle lavée, il est probable qu’elle soit placée dans un égouttoir. Cette capacité à prédire et à planifier est une étape vers la capacité de l’IA à agir seule, sans que nous ayons besoin de la guider à chaque étape.

Lorsqu’il s’agit d’accomplir des tâches, l’IA est devenue plus indépendante. Si elle pense que la vaisselle doit être mise dans l’égoutoir, elle le fera d’elle-même. Cela montre que l’IA devient plus autonome et peut prendre des initiatives.

Des changements structurels

Autre nouveauté : l’IA peut désormais revenir sur ce qu’elle a fait et juger de son efficacité. Une fois qu’elle a terminé une tâche, Figure 01 peut décider si elle a atteint son objectif. Cette auto-évaluation est essentielle pour que l’IA apprenne de ses actions et s’améliore au fil du temps.

L’impact de la mise à jour de OpenAI est énorme. Il ne s’agit pas seulement de l’aspect technique, mais aussi de la façon dont l’IA s’intègre dans notre vie quotidienne. Grâce à de meilleures capacités de synthèse vocale, il sera plus naturel de parler et de travailler avec l’IA. À mesure que Figure 01 et d’autres systèmes d’IA s’améliorent, ils pourraient nous aider de bien des façons, que ce soit en nous facilitant la vie à la maison ou en changeant la façon dont les choses sont faites dans les industries.

Lire plus
Intelligence Artificielle

Nouvelle ère pour Copilot : Microsoft adopte GPT-4 Turbo pour une intelligence amplifiée

OMB BLOG MAIN HERO 16x9 1 960x64 1

Microsoft a annoncé que son assistant d’intelligence artificielle Copilot bénéficiait d’une augmentation considérable des performances pour les utilisateurs payants et gratuits. Ils intègrent Copilot avec GPT-4 Turbo d’OpenAI.

Les utilisateurs professionnels avec des cas d’utilisation de niche ne sont pas oubliés non plus, car ils ajoutent également une fonction de basculement pour que les gens puissent revenir au GPT-4 standard si nécessaire.

Selon Mikhail Parakhin, responsable de l’équipe Windows and Web Experiences chez Microsoft depuis le départ de Panos, tous les modes de Copilot auront accès au GPT-4 Turbo, mais chaque mode a été affiné pour déterminer dans quelle mesure utiliser le Turbo par rapport au GPT-4 normal.

Cependant, il y a une petite entorse à la règle et GPT-4 Turbo n’est pas exactement actif par défaut à tout moment. Les modes Créatif et Précis sont presque entièrement intégrés au GPT-4 Turbo, tandis que le mode Équilibré n’utilise le GPT-4 Turbo que dans certains cas.

Parakhin a également déclaré que les utilisateurs de la version gratuite de Copilot seraient en mesure d’utiliser GPT-4 Turbo à tout moment, mais selon la page de tarification de Copilot, les utilisateurs gratuits sont toujours limités aux heures creuses. Il n’est pas certain que cette divergence d’informations soit simplement due au fait que la page de tarification n’a pas encore été mise à jour.

Quels sont les avantages de GPT-4 Turbo ?

M365Copilot HeroBanner Apps BLOG jpg

Lancé plus tôt cette année dans le cadre d’une importante mise à jour d’OpenAI, GPT-4 Turbo est une version améliorée du modèle ChatGPT d’OpenAI et est plus puissant que les modèles précédents.

L’une des mises à jour les plus remarquables de ce nouveau mode est qu’il a désormais connaissance des événements jusqu’en avril 2023. Elon Musk a fait grand cas de la capacité de son IA Grok à s’intéresser aux événements en temps réel, et la rivalité entre Grok et OpenAI a atteint de nouveaux sommets après que Musk a annoncé son intention de mettre Grok en open source. Les connaissances plus récentes de GPT-4 Turbo aideront donc le modèle à rester pertinent dans un monde où la concurrence est féroce.

Le modèle Turbo dispose d’une fenêtre contextuelle beaucoup plus grande de 128 ko, ce qui signifie qu’il peut accepter une quantité beaucoup plus importante de prompts de la part des utilisateurs.

Lire plus
Intelligence Artificielle

Révolution dans le gaming : DeepMind dévoile SIMA, l’IA aux compétences humaines

58119445 7968 4f91 b597 b6c55c1a66bd

Imaginez que vous jouiez à votre jeu de rôle préféré, mais qu’au lieu d’affronter des ennemis informatisés déterminés à vous vaincre tout seul, vous ayez un puissant compagnon — un agent d’intelligence artificielle (IA) avancé qui apprend et se comporte comme un joueur humain.

Ce mercredi 13 mars, DeepMind, la filiale de recherche en IA de Google, a dévoilé SIMA, un agent d’IA révolutionnaire conçu pour apprendre et jouer à des jeux vidéo de la même manière qu’un joueur humain.

Contrairement à l’IA traditionnelle qui est programmée pour gagner à tout prix, SIMA est entraînée à jouer et à suivre des instructions, imitant ainsi l’expérience de jeu naturelle d’un participant humain.

Comment fonctionne SIMA de Google DeepMind ?

SIMA (Scalable, Instructable, Multiworld Agent) est actuellement en phase de recherche, mais il s’agit d’une étape importante vers le développement d’agents d’intelligence artificielle généraux et performants. L’agent est développé pour apprendre à jouer à n’importe quel jeu vidéo, y compris les jeux à monde ouvert et ceux qui n’ont pas de parcours linéaire.

« SIMA n’est pas formé pour gagner un jeu ; il est formé pour l’exécuter et faire ce qu’on lui demande », explique Tim Harley, chercheur chez Google DeepMind et co-responsable du projet SIMA. « Il mélange l’enseignement du langage naturel avec la compréhension des mondes en 3D et la reconnaissance d’images ».

Pour entraîner SIMA, Google DeepMind a collaboré avec 8 développeurs de jeux, dont des studios tels que Hello Games, Embracer, Tuxedo Labs et Coffee Stain. Les chercheurs ont intégré SIMA à divers jeux, tels que No Man’s Sky, Teardown, Valheim et Goat Simulator 3, afin d’enseigner à l’agent IA les principes de base du jeu.

Le processus de formation a comporté plusieurs étapes, notamment la création d’un environnement personnalisé dans le moteur Unity où les agents ont appris à manipuler des objets en créant des sculptures.

Il y a encore du travail ?

Les chercheurs ont ensuite enregistré des paires de joueurs humains, l’un contrôlant le jeu et l’autre donnant des instructions, afin de saisir les indices linguistiques. Ces données ont ensuite été transmises à SIMA pour l’aider à prédire les événements à l’écran en fonction des actions et des instructions.

Mais, il reste encore un long chemin à parcourir avant que SIMA puisse être déployé. Il apprend à marcher avant de pouvoir courir.

Actuellement, SIMA maîtrise environ 600 compétences de base, telles que tourner à gauche, monter à l’échelle et ouvrir les menus d’un jeu. Toutefois, l’équipe envisage que SIMA puisse éventuellement être chargé d’exécuter des fonctions plus complexes dans les jeux, comme la recherche de ressources et la construction de camps.

Lire plus
Intelligence Artificielle

Révolutionnez la conception Web : Transformez des images en sites avec ChatGPT

a4d1c28b 97b4 4c99 ab1a a6bc076cc058

Ce guide vous montrera comment créer un site Web avec l’aide de ChatGPT. Dans le paysage dynamique et en constante évolution de l’ère numérique, la capacité à transformer rapidement des idées abstraites en résultats tangibles est plus qu’un avantage, c’est une nécessité, en particulier dans le domaine du développement Web.

Pour ceux qui s’intéressent de près à l’esthétique et à la fonctionnalité de la conception de sites Web, mais qui se heurtent à un manque d’expertise en matière de codage, il y a de bonnes nouvelles.

L’émergence de technologies d’IA avancées, notamment ChatGPT et sa plus récente mise à jour, GPT-4, a révolutionné le processus de création de sites Web. Cette avancée permet de convertir de simples images représentant des conceptions de sites Web en sites Web interactifs et pleinement opérationnels.

Ce guide complet est conçu pour vous accompagner dans le processus nuancé de recréation de sites Web avec l’aide de ChatGPT. Il promet de démystifier les complexités impliquées, vous permettant d’actualiser vos aspirations numériques efficacement et avec une réduction remarquable des obstacles techniques.

Imaginez que vous puissiez recréer n’importe quel site Web à partir d’une simple capture d’écran. C’est exactement ce qu’offre ChatGPT. En fournissant des instructions détaillées à ChatGPT, vous pouvez le guider pour qu’il génère le code HTML et CSS nécessaire à la conception de votre site Web. Ce processus met en évidence l’importance de la précision de vos prompts pour obtenir des résultats qui correspondent étroitement à votre vision.

Votre compagnon étape par étape

  • Capturez votre vision : Tout commence par une capture d’écran du site Web que vous souhaitez recréer. Cette image sert de base à votre projet.
  • Rédigez des prompts détaillées : Utilisez ces prompts pour guider ChatGPT dans la génération du code. Cela implique de spécifier vos exigences en matière de design, de la mise en page à la palette de couleurs.
  • Testez et peaufinez : Des plateformes comme CodePen sont votre terrain de jeu pour tester le code généré. Cette étape est cruciale pour affiner l’apparence et la fonctionnalité de votre site Web.

Au-delà de la conception de base : Personnalisation et éléments interactifs

Un site Web n’est pas seulement une question d’apparence, mais aussi de fonctionnalité et d’expérience utilisateur. Ce guide explique comment améliorer votre site Web :

  • Personnalisation du contenu : Apprenez à adapter le contenu et la mise en page section par section, afin de vous assurer que votre site communique efficacement votre message.
  • Amélioration de la conception : Utilisez des outils externes pour sélectionner des palettes de couleurs qui rehaussent l’esthétique de votre site Web.
  • Composants interactifs : Ajoutez des fonctionnalités telles que des formulaires en temps réel à l’aide de services tels que Formspark, afin de rendre votre site non seulement attrayant sur le plan visuel, mais aussi interactif et convivial.

Un outil pour votre développement Web

Que vous soyez un développeur Web en herbe ou un individu créatif cherchant à concrétiser ses idées numériques, l’intégration de l’IA par ChatGPT ouvre un nouveau champ de possibilités. En faisant tomber les barrières du développement Web, ChatGPT vous permet de créer, de personnaliser et de lancer des sites Web qui résonnent avec votre marque personnelle ou professionnelle.

S’appuyant sur les capacités de GPT-4, ce guide complet fournit une approche étape par étape de la transformation d’une simple image en un site Web pleinement opérationnel. De la conception initiale du design aux subtilités de l’hébergement, vous disposerez des connaissances nécessaires pour naviguer dans le processus de développement Web avec confiance et créativité.

L’aventure ne s’arrête pas à la conception et au développement. L’hébergement de votre site Web est la prochaine étape cruciale.

.

Lire plus
Intelligence Artificielle

Microsoft lance Copilot Pro dans le monde entier avec un mois d’essai gratuit

1920x1080 Copilot Blog Image

Microsoft a récemment étendu la disponibilité de son abonnement Copilot Pro, initialement lancé pour les consommateurs en janvier. Cette expansion permet à Copilot Pro d’être accessible dans un total de 222 pays. Pour encourager les abonnements à cette vision AI de l’avenir, Microsoft propose un essai gratuit d’un mois.

L’abonnement Copilot Pro offre un accès prioritaire aux modèles OpenAI les plus récents, permet de personnaliser son propre Copilot GPT, et intègre Copilot dans les applications Office pour les abonnés de Microsoft 365 Personal ou Home. Désormais, cette intégration s’étend aux applications Web Office, permettant l’utilisation du chatbot dans Word, Outlook et d’autres applications web gratuites, sans nécessiter d’abonnement Microsoft 365 distinct.

Une extension de cette intégration aux applications mobiles est également prévue. Divya Kumar, directrice générale du marketing de recherche et d’IA chez Microsoft, annonce que ces avantages seront bientôt étendus aux applications mobiles gratuites, y compris Microsoft 365 et Outlook pour iOS et Android.

Pour découvrir Copilot Pro, les utilisateurs sont invités à installer l’application Copilot sur iOS ou Android et bénéficier de l’offre d’un mois gratuit. Microsoft stimule l’adoption de son application mobile Copilot, notamment avec une publicité au Super Bowl axée sur la version mobile.

Des améliorations dans les mois à venir

L’entreprise élargit également la disponibilité de Copilot pour Microsoft 365 aux entreprises, avec des offres disponibles prochainement pour différents plans d’abonnement.

Microsoft prévoit de dévoiler davantage d’améliorations pour Copilot dans les mois à venir, y compris des modifications pour Windows 11 qui seront probablement présentées lors de la conférence des développeurs Build en mai.

Lire plus
Intelligence Artificielle

ChatGPT-5 en préparation : OpenAI renforce sa gouvernance et sa mission

raw 9

OpenAI a publié de nouveaux détails sur sa direction et sur les personnes qui superviseront le développement et la sortie de ChatGPT 5. Le mois dernier, il a été révélé que la formation complète de GPT-5 était déjà en cours, grâce aux tweets de Greg Brockman, président et cofondateur d’OpenAI, et de Jason Wei, l’un des principaux chercheurs d’OpenAI.

La semaine dernière, OpenAI a confirmé que Sam Altman et Greg Brockman ont été réintégrés à la direction d’OpenAI après un examen indépendant effectué par le cabinet d’avocats WilmerHale. Sue Desmond-Hellmann, Nicole Seligman et Fidji Simo, qui apportent une expérience diversifiée dans différents secteurs.

Parmi les autres nouvelles, OpenAI a apporté des améliorations à sa structure de gouvernance, notamment un nouvel ensemble de lignes directrices en matière de gouvernance d’entreprise, une politique renforcée en matière de conflits d’intérêts et la création d’une ligne d’assistance téléphonique pour les dénonciateurs. Elle a également confirmé la création d’un nouveau comité chargé de faire progresser la mission principale de OpenAI. Voyons ce qu’il y a de nouveau chez OpenAI et comment cela affectera le développement de ChatGPT-5.

OpenAI a accueilli trois personnalités impressionnantes au sein de son conseil d’administration : Sue Desmond-Hellmann, Nicole Seligman et Fidji Simo. Grâce à leur expérience dans les domaines de la biotechnologie, des questions juridiques et de l’industrie technologique, ces nouveaux membres apportent une grande richesse de connaissances et d’expériences. Leurs points de vue seront inestimables pour permettre à OpenAI de naviguer dans le paysage complexe du développement de l’IA.

Développement de ChatGPT 5

Mais, il ne s’agit pas seulement de savoir qui est autour de la table. OpenAI a également introduit de nouvelles politiques pour s’assurer que tout ce qu’elle fait est transparent et éthique. Elle a établi des lignes directrices claires sur la manière dont l’entreprise doit être gérée, une politique de gestion des conflits d’intérêts et même une ligne téléphonique d’urgence pour les dénonciateurs. Ces mesures visent à s’assurer que OpenAI est responsable et que les gens se sentent à l’aise pour parler si quelque chose ne va pas. L’AIGRID a élaboré un utile aperçu de tout ce qui a été révélé cette semaine concernant OpenAI et sa structure commerciale.

Mission et stratégie de OpenAI

L’un des développements les plus excitants est la création du Comité de mission et de stratégie. Ce groupe se concentre sur l’orientation de OpenAI vers la création d’une intelligence générale artificielle (AGI) — un type d’IA capable de comprendre, d’apprendre et d’appliquer des connaissances d’une manière analogue à l’intelligence humaine. Le comité veillera à ce que chaque projet et initiative de OpenAI s’inscrive dans cette mission.

Ces changements interviennent après un examen approfondi effectué par le cabinet d’avocats WilmerHale, qui n’a décelé aucun problème de sécurité dans les produits de OpenAI ni aucune inquiétude quant à la rapidité de leur développement. Toutefois, cette étude a mis en lumière certains problèmes de gouvernance antérieurs, tels que des désaccords entre d’anciens membres du conseil d’administration et Altman. Avec les nouveaux membres du conseil d’administration et les nouvelles politiques mises en place, OpenAI est déterminée à tirer les leçons de ces expériences et à construire une organisation plus forte et plus unifiée.

Les anciens membres du conseil d’administration ont eu une influence significative sur ces nouveaux changements. Leurs commentaires ont été cruciaux dans l’élaboration d’une structure de gouvernance solide et capable d’empêcher que les problèmes du passé ne se reproduisent. Sam Altman lui-même a reconnu qu’il y avait eu des erreurs dans la façon dont OpenAI était gouvernée. Il s’est engagé à rectifier le tir et à veiller à ce que la gouvernance du laboratoire soit pleinement en phase avec sa mission. Il est clair qu’il est déterminé à mener OpenAI vers un avenir où elle pourra vraiment faire la différence.

Ce que nous savons de ChatGPT 5

  • Indications de lancement et d’entraînement : OpenAI a commencé l’entraînement complet de GPT-5. Le tweet de Brockman suggère un mouvement visant à maximiser l’exploitation de toutes les ressources informatiques pour leur plus grand modèle à ce jour, tandis que le tweet de Wei souligne l’excitation suscitée par le lancement d’entraînements massifs sur GPU.
  • Approche de l’entraînement des modèles : OpenAI entraîne généralement des modèles plus petits (environ un millième de la taille du modèle complet) pour recueillir des informations avant de procéder à un entraînement complet. Cette approche permet de prédire et de comprendre scientifiquement les systèmes résultant de ces modèles.
  • Essais de sécurité et membres de la Red Team : La clôture des candidatures pour le réseau de la Red Team indique le début des phases d’essais de sécurité pour le GPT-5. Les « red teamers » jouent un rôle essentiel dans l’identification des potentielles faiblesses ou des problèmes de sécurité avant la diffusion publique.
  • Améliorations progressives et endpoints : Avant d’atteindre GPT-5, OpenAI pourrait publier des mises à jour incrémentales ou des endpoints (appelés GPT-4.2), s’écartant ainsi de son approche historique de mises à jour peu fréquentes mais significatives du modèle.
  • Capacités du modèle et domaines d’intérêt :
    • Incorporation de méthodes permettant à ChatGPT-5 de « penser » plus longtemps en présentant des étapes de raisonnement plus complètes, potentiellement vérifiées à la fois en interne et en externe.
    • Amélioration de la multimodalité, y compris du traitement de la parole, des images et éventuellement de la vidéo.
    • Une plus grande importance accordée aux capacités de raisonnement et à la fiabilité. Par exemple, la capacité du modèle à fournir des réponses plus cohérentes et plus fiables pour de nombreuses requêtes.
    • L’introduction ou l’amélioration de mécanismes permettant de vérifier ou de comprendre le processus de raisonnement de l’IA.
  • Taille et architecture du modèle : D’après une interview de Gavin Uberti, PDG d’Etched AI, le modèle GPT-5 pourrait compter 10x plus de paramètres que le modèle GPT-4, ce qui pourrait être obtenu grâce à des dimensions d’intégration plus importantes, à un plus grand nombre de couches et à un doublement du nombre d’experts.
  • Applications et conseils pratiques :
    • Le potentiel de GPT-5 pour améliorer de manière significative les performances en codage, en mathématiques et dans les domaines des STIM grâce à un raisonnement et une fiabilité accrus.
    • Un conseil pratique partagé concerne la capacité du modèle à comprendre et à corriger un texte brouillé ou rempli de fautes de frappe, ce qui indique de solides capacités de compréhension du langage.
  • Calendrier de sortie et considérations de sécurité : Les spéculations suggèrent un calendrier de diffusion vers la fin du mois de novembre 2024, compte tenu de la durée de la formation, des tests de sécurité et de l’évitement potentiel d’une diffusion au cours de la période électorale controversée aux États-Unis.
  • Données multilingues et sécurité : L’accent est mis sur l’inclusion d’un plus grand nombre de données multilingues dans l’ensemble de formation de GPT-5, en partie pour des raisons de sécurité et pour répondre à la facilité de « jailbreaking » des modèles dans des langues autres que l’anglais.
  • Orientations futures et impact sur l’industrie :
    • La vision de OpenAI est d’utiliser l’IA comme une sorte de système d’exploitation, d’améliorer l’interaction vocale en temps réel et d’étendre les capacités multimodales.
    • Les améliorations spectaculaires attendues en matière de raisonnement, de fiabilité et de compréhension de l’IA, ainsi que l’impact potentiel du GPT-5 et des modèles futurs sur l’industrie.

Vers l’AGI

Qu’est-ce que tout cela signifie pour l’OpenAI et pour le reste du monde ? Ces mises à jour marquent un tournant pour l’organisation. Avec un conseil d’administration plus fort, de meilleures politiques et une orientation claire sur sa mission, OpenAI montre comment développer l’AGI de manière responsable. Elle établit une norme sur la façon dont les laboratoires de recherche en IA devraient fonctionner — avec intégrité et un dévouement inébranlable à l’amélioration de la condition humaine.

Alors que nous observons OpenAI aller de l’avant, il est clair qu’elle ne se contente pas de parler d’avoir un impact positif, mais qu’elle met tout en œuvre pour y parvenir. Ses actions témoignent d’une profonde compréhension de la responsabilité qui accompagne le développement de puissantes technologies d’IA. Pour tous ceux qui s’intéressent à l’avenir de l’IA, le parcours d’OpenAI est à suivre de près.

OpenAI ne se contente pas de façonner l’avenir de la technologie ; elle façonne aussi l’avenir de la façon dont nous vivons avec cette technologie et dont nous en bénéficions.

Lire plus
Intelligence Artificielle

Le générateur de texte-vidéo Sora de OpenAI accessible au public courant 2024

openai sora screen

L’anticipation monte autour de Sora ! OpenAI s’apprête à révolutionner une fois de plus le monde de l’intelligence artificielle avec son générateur de texte-à-vidéo, nommé Sora.

Mira Murati, la directrice technique d’OpenAI, a annoncé lors d’une interview avec The Wall Street Journal que Sora serait accessible au grand public « cette année », soulignant que sa disponibilité pourrait être question de quelques mois. Initialement, OpenAI avait restreint l’accès à Sora à un groupe fermé de chercheurs et de créateurs, cherchant à déceler et rectifier les éventuelles failles avant un déploiement plus large.

L’enjeu de ce développement prudent réside dans la nécessité de surmonter divers défis techniques et éthiques, illustrés récemment par la controverse entourant l’IA Gemini de Google, qui a produit des images historiquement inexactes, provoquant l’indignation publique. Ces incidents soulignent l’importance cruciale de peaufiner ces technologies avant leur introduction généralisée.

Dévoilé pour la première fois en février, Sora a la capacité de créer des scènes hyper-réalistes à partir de simples prompts textuels. Initialement, cette technologie était réservée aux artistes visuels, designers et cinéastes. Néanmoins, des vidéos générées par Sora ont rapidement trouvé leur chemin sur diverses plateformes en ligne.

L’intention d’OpenAI est de ne pas seulement rendre Sora accessible à tous, mais aussi d’intégrer à terme une fonctionnalité audio pour enrichir davantage le réalisme des scènes générées. De plus, la société envisage de permettre aux utilisateurs de modifier le contenu des vidéos produites, une flexibilité nécessaire puisque les outils d’IA ne génèrent pas toujours des images fidèles à la réalité.

Un coût élevé

a tale of caution and promises 1 jpg

Concernant les données utilisées pour entraîner Sora, Murati est restée évasive, se limitant à mentionner que les données étaient issues de sources publiques ou sous licence, confirmant uniquement l’utilisation de contenus de Shutterstock, partenaire d’OpenAI.

Murati a également évoqué le coût élevé du fonctionnement de Sora, tout en assurant que l’objectif était de rendre l’outil financièrement accessible, analogue à DALL-E, le modèle de génération texte-image d’OpenAI.

À l’approche des élections présidentielles de 2024 aux États-Unis, le potentiel impact des outils d’IA générative sur la création de désinformation est un sujet de préoccupation croissante. À sa sortie, Sora devrait implémenter des restrictions analogues à celles de DALL-E, notamment l’impossibilité de produire des images de personnalités publiques, et intégrer un filigrane afin de différencier les créations de la réalité, malgré les limites que cela peut impliquer.

Lire plus
Intelligence Artificielle

ChatGPT s’adapte à votre style : Innovation vocale sur PC

file wiwniFyjrY8qYvcqodSI8Idk

Avez-vous déjà souhaité pouvoir changer la voix de ChatGPT pour qu’elle corresponde un peu mieux à votre style de conversation ? Cette fonction vocale, qui n’était disponible que sur les appareils mobiles, est désormais accessible aux utilisateurs d’ordinateurs de bureau.

Cela signifie que vous pouvez désormais avoir des conversations avec ChatGPT qui sonnent exactement comme vous le souhaitez, ce qui rend vos interactions plus naturelles et adaptées à vos goûts personnels. Il vous suffit de poser une question à ChatGPT, puis d’appuyer sur le bouton du haut-parleur intitulé « Lire à voix haute » à la fin des résultats pour que la question vous soit posée avec la voix de votre choix.

Une sélection de voix différentes est disponible dans le menu des paramètres de ChatGPT.

Paramètres et voix de ChatGPT

Lorsque vous commencerez à personnaliser les voix d’IA sur votre ChatGPT de bureau, vous verrez que c’est un jeu d’enfant. Plongez dans le menu des paramètres et vous découvrirez une variété de voix, chacune avec son propre caractère. Vous pouvez préférer une voix qui donne une impression d’autorité ou une voix plus amicale. Le choix est entre vos mains.

Vous êtes peut-être curieux de savoir à quoi ressemblent ces différentes voix. ChatGPT vous propose un moyen amusant de le découvrir. L’IA vous racontera des blagues avec les différentes voix. Cela vous permet non seulement d’entendre les différences entre les voix, mais aussi d’ajouter une touche d’humour à votre journée.

Mais il ne s’agit pas seulement de choisir une voix. Vous pouvez également ajuster la façon dont l’IA parle pour mieux l’adapter au contexte de votre conversation. Si vous discutez de quelque chose de sérieux, vous voudrez peut-être que la voix soit plus pressante. Ou si vous cherchez à vous détendre, vous préférerez peut-être un ton plus calme. Ces changements subtils peuvent donner à votre chatbot l’impression de parler à une personne réelle.

L’un des aspects les plus intéressants de cette nouvelle fonctionnalité est qu’elle permet de maintenir des conversations intéressantes. L’IA peut modifier son style d’élocution afin de ne pas paraître répétitive ou ennuyeuse. Cela permet de garder vos conversations vivantes et d’améliorer votre expérience globale.

Comment personnaliser le discours de ChatGPT ?

Créer une expérience de conversation plus immersive avec ChatGPT implique de personnaliser sa sortie vocale. Cela peut améliorer l’engagement de l’utilisateur et rendre les interactions plus personnalisées. Vous trouverez ci-dessous un guide complet sur la façon de personnaliser la voix de ChatGPT pour une conversation plus immersive :

Accéder aux paramètres vocaux

  • Accédez aux paramètres : Commencez par accéder aux paramètres de votre compte. Cela se trouve généralement dans la barre latérale ou sous une icône de profil dans l’interface de ChatGPT.
  • Sélectionnez Speech : Cherchez une option intitulée « Speech ». C’est là que vous pouvez accéder aux fonctions de personnalisation de la voix.

Screen 2024 03 13 07.20.51 jpg

Choisir une voix

  • Prévisualisez les voix disponibles : ChatGPT offre actuellement une sélection de voix, chacune avec des caractéristiques uniques. Prévisualisez chaque voix pour comprendre son ton, sa hauteur et son rythme et choisissez celle qui correspond à vos préférences. Vous pouvez vous attendre à ce que OpenAI ajoute d’autres voix au fil du temps ou mette à disposition d’autres paramètres.
  • Sélectionnez une voix : Choisissez une voix qui correspond à votre style de conversation. Cela peut être basé sur la chaleur de la voix, le sérieux ou tout autre attribut qui améliore l’expérience de la conversation.

Personnalisation des paramètres vocaux

  • Ajuster la vitesse : Certaines plateformes vous permettent d’ajuster la vitesse d’élocution de la voix. En ralentissant l’élocution, le ChatGPT peut sembler plus délibéré et réfléchi, tandis qu’en l’accélérant, il peut transmettre de l’excitation ou de l’urgence.
  • Modifier le ton : Le réglage de la hauteur de la voix peut modifier l’âge ou le sexe perçu de la voix, contribuant ainsi à une expérience de conversation plus personnalisée.
  • Contrôler le volume : Bien que le contrôle du volume soit généralement effectué par l’utilisateur, le fait d’être attentif au niveau de volume par défaut peut améliorer le confort de l’interaction.

Appliquer des modulations vocales spécifiques au contexte

  • Utiliser des indices émotionnels : Spécifiez des indices émotionnels dans vos prompts pour encourager ChatGPT à utiliser un ton de voix qui correspond à l’émotion, comme l’excitation, le calme ou l’urgence.
  • Incorporez des pauses et des variations de rythme : Demander des pauses ou des changements de rythme peut imiter les modèles de discours naturels, rendant la conversation plus dynamique et engageante.

Personnalisation avancée

  • Balises vocales : Certaines plateformes permettent d’utiliser des balises dans le texte pour spécifier des changements de voix directement dans le prompt. Il peut s’agir de changer de voix ou de moduler la hauteur et le rythme au milieu de la conversation. Essayez de personnaliser vos prompts pour aider ChatGPT à donner l’impression d’être plus réaliste dans ses réponses.
  • Modèles de discours : Pour les plateformes qui le supportent, vous pouvez définir des modèles de discours spécifiques, tels que le souffle, le chuchotement ou la robustesse, afin de personnaliser davantage la voix de ChatGPT.

Désormais, avec la possibilité de sélectionner et d’affiner les voix d’IA sur votre bureau, vous pouvez profiter de conversations plus personnelles et plus engageantes. Pourquoi ne pas essayer ? Jouez avec les paramètres, écoutez quelques blagues et ajustez les modèles vocaux à votre convenance. Vous pourrez ainsi avoir avec votre IA des conversations aussi uniques et agréables que celles que vous avez avec d’autres personnes.

Lire plus
Intelligence Artificielle

GPT-4.5 Turbo : La prochaine révolution d’OpenAI dévoilée par erreur ?

openai logo 1

La nuit dernière, sur Reddit, un article a suscité l’intérêt de la communauté de l’IA pour le prochain modèle GPT-4.5 Turbo d’OpenAI. L’entreprise semble avoir accidentellement publié un article de blog sur le modèle GPT-4.5 Turbo qui a été indexé par Bing et DuckDuckGo.

La méta-description indique que le modèle GPT-4.5 Turbo surpasse le modèle GPT-4 Turbo en termes de vitesse, de précision et d’évolutivité.

Cela a suscité la curiosité de nombreux utilisateurs sur Reddit et X (anciennement Twitter). J’ai également essayé d’accéder au blog de OpenAI pour le modèle GPT-4.5 Turbo à partir d’ici, mais une erreur 404 s’est produite. Actuellement, sur Bing et DuckDuckGo, la page a été désindexée et n’apparaît plus sur le moteur de recherche.

Un autre post sur X démontre également que GPT-4.5 Turbo est mentionné dans le code source de la page Web. On peut y lire ce qui suit :

OpenAI a annoncé GPT-4.5 Turbo. GPT-4 Turbo est un nouveau modèle qui dépasse GPT-4 Turbo en termes de vitesse, de précision et d’évolutivité. Voyez comment GPT-4.5 Turbo peut générer du langage naturel et du code avec une fenêtre contextuelle de 256k et une date limite de connaissance fixée à juin 2024.

Étrangement, la description capturée indique que GPT-4.5 Turbo aura une date limite de connaissance allant jusqu’à juin 2024. Beaucoup pensent qu’il pourrait s’agir d’une erreur de frappe ou que OpenAI pourrait publier le modèle GPT-4.5 Turbo dans les trois ou quatre prochains mois, vers juillet ou août. Quoi qu’il en soit, il semble que OpenAI publiera un modèle intermédiaire avant de lancer le modèle GPT-5 de nouvelle génération.

Enfin une amélioration de 256 000 jetons

Cela dit, la bonne nouvelle est que OpenAI élargit enfin la fenêtre de longueur du contexte et qu’elle apportera la prise en charge des jetons de 256 000 avec le modèle GPT-4.5 Turbo. Avec le modèle GPT-4 Turbo actuel, vous ne pouvez traiter que jusqu’à 128 000 jetons. Après le lancement des modèles Claude 3 (200K) et Gemini 1.5 Pro (1 million), il est temps pour OpenAI de redoubler d’efforts pour élargir la fenêtre contextuelle.

Pensez-vous qu’OpenAI va lancer le modèle GPT-4.5 Turbo dans les prochains mois ?

Lire plus