Alexa version 2.0 : Amazon prépare une mise à jour d’Alexa avec de l’IA et un abonnement payant

par Yohann Poiron le 29 août 2024

Amazon travaille depuis un certain temps sur une mise à jour révolutionnaire d’Alexa, alimentée par l’intelligence artificielle (IA). Bien que cette version améliorée ne soit pas encore disponible pour le grand public, il semble que nous ayons enfin une fenêtre de lancement, et elle est plus proche que prévu.

Selon des informations internes relayées par The Washington Post, la nouvelle version d’Alexa, tant attendue, devrait être lancée en octobre prochain. Alors que les assistants vocaux concurrents basés sur l’IA se multiplient, Amazon semble prête à élever son jeu et à proposer une Alexa repensée aux utilisateurs.

L’une des rumeurs les plus commentées concerne le fait que cette nouvelle Alexa alimentée par l’IA pourrait être proposée sous la forme d’un abonnement, avec un tarif pouvant aller jusqu’à 10 dollars par mois. Cependant, la version classique d’Alexa restera disponible gratuitement pour les utilisateurs. Amazon devrait finaliser les détails du prix, de l’abonnement et du nom de ce nouveau produit d’ici la fin de ce mois.

Nouvelles fonctionnalités d’Alexa : Smart Briefing et plus encore

La mise à jour sera lancée juste avant l’élection présidentielle américaine, et elle introduira une nouvelle fonctionnalité appelée Smart Briefing. Celle-ci proposera des résumés quotidiens d’articles de presse, créés par l’IA et personnalisés en fonction des habitudes de lecture de chaque utilisateur.

Connue sous le nom de Remarkable Alexa ou Project Banyan dans les documents internes, cette version améliorée d’Alexa pourrait également apporter de nombreuses autres fonctionnalités inédites. Parmi elles, des recommandations de recettes, un chatbot adapté aux enfants, et possiblement de nouveaux outils pour le shopping conversationnel.

En parallèle de la nouvelle version d’Alexa, Amazon prévoit de lancer un autre projet très attendu : Project Metis. Il s’agira d’un chatbot basé sur le Web, conçu pour rivaliser directement avec ChatGPT d’OpenAI et Gemini de Google.

Avec cette mise à jour, Amazon vise à rendre Alexa plus interactive et engageante. L’assistant sera capable de reconnaître les voix uniques des utilisateurs et de poser des questions pour offrir une assistance plus personnalisée.

Une tendance lourde dans le secteur des assistants vocaux

Cette initiative s’inscrit dans une tendance plus large du secteur. Par exemple, ChatGPT a récemment lancé son nouveau mode vocal, capable de détecter les émotions pour des conversations plus authentiques en temps réel. De son côté, Apple travaille sur une refonte de Siri pour qu’il paraisse plus naturel et conversationnel. Désormais, Alexa rejoint ce mouvement, avec un objectif commun : rendre les assistants vocaux plus humains, un défi qui, pour certains, peut sembler un peu perturbant.

Cette mise à jour majeure pourrait bien marquer un tournant dans l’évolution des assistants vocaux, avec des implications potentiellement vastes pour la façon dont nous interagissons avec nos appareils au quotidien.

Lire plus

Intelligence Artificielle

Google déploie les Gems sur Gemini : Des assistants IA personnalisés pour tous

par Yohann Poiron le 29 août 2024

Google a annoncé mardi des mises à jour importantes de sa plateforme d’intelligence artificielle Gemini, en introduisant les « Gems », des assistants d’intelligence artificielle personnalisés, et Imagen 3, un modèle de génération d’images amélioré. Ces améliorations représentent le dernier effort de Google pour être compétitif sur le marché de l’intelligence artificielle, qui évolue rapidement.

La première présentation des Gems a eu lieu lors de la conférence Google I/O en mai dernier. Google avait alors montré un exemple de Gem conçu pour être « connaisseur, décontracté et amical », destiné à aider les utilisateurs à planifier des jardins nécessitant peu ou pas d’eau.

Gems permet aux utilisateurs de Gemini Advanced, Business et Enterprise dans plus de 150 pays de créer des assistants IA spécialisés. Les utilisateurs peuvent désormais créer des experts numériques pour des tâches spécifiques, qu’il s’agisse de tuteurs de codage ou de stratèges en marketing. Cette fonctionnalité démocratise les capacités de l’IA, transformant potentiellement la façon dont les particuliers et les entreprises exploitent l’intelligence artificielle.

Les utilisateurs peuvent créer un Gem en fournissant des instructions, en lui donnant un nom et en interagissant avec lui chaque fois qu’ils ont besoin d’aide.

Comme indiqué précédemment, les potentielles applications des Gem sont vastes, du brainstorming à la rédaction de légendes pour les réseaux sociaux. Pour aider les utilisateurs à démarrer, Google a également lancé un ensemble de Gems préfabriqués pour différents scénarios, tels qu’un coach d’apprentissage, un brainstormer, un guide de carrière, un éditeur d’écriture et un partenaire de codage.

L’arrivée des Gems est une réponse de Google à OpenAI

En simplifiant la création d’assistants spécialisés, Google vise à stimuler l’innovation dans tous les secteurs. Les petites entreprises pourraient désormais accéder à des outils d’IA auparavant réservés aux géants de la technologie, tandis que les particuliers pourraient consulter des experts en IA personnalisés à la demande.

Cette évolution vers des assistants d’IA spécialisés dans des tâches précises répond aux limites des modèles linguistiques à large spectre comme GPT-4o. Les assistants spécialisés pourraient offrir des solutions plus pratiques et plus efficaces, réduisant potentiellement les problèmes tels que les réponses non pertinentes qui affectent parfois l’IA à usage général.

Les Gems sont actuellement déployés sur les ordinateurs de bureau et les appareils mobiles pour les utilisateurs de Gemini Advanced, Business et Enterprise dans plus de 150 pays et dans la plupart des langues. Ce lancement de Google semble être une réponse à OpenAI, qui permet à ses utilisateurs de créer leurs propres chatbots depuis plusieurs mois déjà. OpenAI va encore plus loin en offrant la possibilité de partager ces GPT personnalisés via sa boutique en ligne.

Lire plus

Intelligence Artificielle

Project Strawberry : OpenAI prépare une révolution dans le raisonnement de ChatGPT

par Yohann Poiron le 28 août 2024

Nous avons déjà entendu dire que OpenAI travaillait sur un nouveau moteur d’IA connu sous le nom de « Project Strawberry ». Il vise à apporter à ChatGPT une capacité de raisonnement de niveau humain et peut résoudre des problèmes mathématiques et de programmation complexes.

Aujourd’hui, un rapport de The Information confirme que OpenAI se prépare effectivement à intégrer le moteur Strawberry dans ChatGPT.

Selon deux sources bien informées, OpenAI pourrait intégrer Project Strawberry à ChatGPT cet automne. The Information a appris que la startup spécialisée dans l’IA a déjà fait une démonstration de Strawberry à des responsables américains de la sécurité nationale. Le rapport indique également que Strawberry a été capable de résoudre le puzzle de mots « Connections » du New York Times lors d’une démonstration interne.

En outre, Strawberry peut également effectuer des recherches approfondies, planifier et exécuter des actions, ce qui lui confère une capacité agentique. L’approche de Strawberry est très analogue à une technique appelée STaR (Self-Taught Reasoner), proposée par des chercheurs de Stanford, qui peut améliorer de manière significative la capacité de raisonnement.

Le Project Strawberry vise à transformer l’IA en se concentrant sur deux aspects essentiels : l’auto-apprentissage et la pensée logique. L’auto-apprentissage permet aux systèmes d’IA de s’améliorer et de s’adapter sans intervention humaine constante, tandis que la pensée logique leur permet de prendre des décisions bien raisonnées sur la base des informations disponibles. Ces avancées sont cruciales pour développer des modèles d’IA plus sophistiqués et plus autonomes.

Pour atteindre ces objectifs, Project Strawberry utilise plusieurs algorithmes clés :

Q-learning : Cet algorithme d’apprentissage par renforcement permet à l’IA d’apprendre des actions optimales grâce à un processus d’essais et d’erreurs, lui permettant de naviguer dans des environnements complexes et de prendre des décisions éclairées.
Algorithme de recherche A* (A-star) : Réputé pour son efficacité dans la recherche de chemin, l’algorithme A* joue un rôle essentiel dans le Project Strawberry, permettant à l’IA de trouver efficacement des solutions optimales aux problèmes.
Théorie du double processus : En intégrant la théorie du double processus, qui implique le système 1 (pensée rapide et intuitive) et le système 2 (pensée lente et délibérée), le Project Strawberry vise à améliorer les processus de prise de décision de l’IA, en trouvant un équilibre entre les jugements rapides et l’analyse approfondie.

Préoccupations : gérer les potentiels risques du Project Strawberry

Bien que le Project Strawberry recèle un potentiel immense, il soulève également plusieurs préoccupations qui doivent être soigneusement examinées et traitées. L’un des risques majeurs est la possibilité de décryptage des codes de chiffrement, où des systèmes d’IA avancés pourraient potentiellement casser les codes de chiffrement, ce qui poserait de graves menaces pour la sécurité. L’atténuation des hallucinations, ou des erreurs dans les résultats de l’IA, est un autre défi crucial qui nécessite une attention particulière. Il est essentiel de garantir l’exactitude et la fiabilité des réponses de l’IA pour empêcher la propagation de fausses informations et maintenir la confiance dans les systèmes d’IA.

Un autre point d’inquiétude concerne l’intensité de calcul du Project Strawberry. Les capacités avancées du projet peuvent nécessiter des ressources de calcul importantes, ce qui entraînera une augmentation des coûts et de la consommation d’énergie. Une gestion efficace des ressources et des techniques d’optimisation seront cruciales pour assurer la durabilité et l’évolutivité du projet.

Par ailleurs, OpenAI travaillerait sur son modèle d’IA de nouvelle génération, dont le nom de code est « Orion ». Il s’agirait du successeur de GPT-4/4o et pourrait être le prochain modèle GPT-5. En outre, Strawberry contribue à la production de données synthétiques de haute qualité pour l’entraînement d’Orion. La date de sortie d’Orion n’est pas encore connue.

Lire plus

Intelligence Artificielle

Imagen 3 : Le générateur d’images de Google maintenant accessible au grand public

par Yohann Poiron le 25 août 2024

En mai dernier, Google a dévoilé pour la première fois Imagen 3, son générateur d’images à partir de texte. Initialement réservé à la plateforme de développement Vertex AI et à une preview privée, cet outil restait hors de portée pour le grand public. Heureusement, la situation vient de changer.

Le géant de la recherche a discrètement annoncé que Imagen 3 est désormais accessible à tous les utilisateurs aux États-Unis, comme le rapporte VentureBeat. Vous pouvez essayer ce générateur d’images mis à jour via l’AI Test Kitchen de Google.

Google affirme que Imagen 3 est son générateur d’images le plus performant à ce jour. L’entreprise met en avant des images générées avec une meilleure précision, une richesse accrue au niveau de l’éclairage, et une réduction des artefacts. De plus, la compréhension des consignes textuelles a été « considérablement améliorée », ce qui permet à Imagen 3 de produire des résultats plus fidèles aux descriptions fournies.

Par ailleurs, Google indique que plusieurs versions de Imagen 3 seront proposées, chacune étant optimisée pour des tâches spécifiques, comme la création de croquis rapides ou la génération d’images en haute résolution.

Imagen 3 alimente également la nouvelle application Pixel Studio disponible sur les téléphones de la série Pixel 9. Cette application permet non seulement de générer des images à partir de texte, mais aussi d’éditer des photos grâce à une intelligence artificielle intégrée au dispositif. Cependant, il n’est pas nécessaire d’acheter un téléphone Pixel 9 pour essayer Imagen 3. L’accès est élargi, offrant ainsi au public la possibilité de découvrir cette technologie prometteuse sans condition restrictive.

Imagen 3 contraste fortement avec Grok

Malgré quelques restrictions peu souples, Imagen 3 contraste fortement avec Grok, le générateur d’images par IA qui vit sur la plateforme X d’Elon Musk. Grok a été utilisé pour générer toutes sortes de contenus sauvages, y compris des images contenant de la drogue, de la violence et des personnalités publiques faisant des choses douteuses.

Mais les outils d’IA de Google ont également connu quelques problèmes. Au début de l’année, Google a cessé de laisser les gens générer des images avec son chatbot Gemini après que des utilisateurs ont constaté qu’il créait des images historiquement inexactes.

Lire plus

Intelligence Artificielle

Ideogram 2.0 éclipse Midjourney avec des images IA plus réalistes et personnalisables

par Yohann Poiron le 23 août 2024

L’introduction de Ideogram 2.0 fait monter d’un cran les enjeux des générateurs d’images IA, d’autant plus que Midjourney vient d’annoncer une mise à jour invitant davantage d’utilisateurs à rejoindre sa plateforme.

Midjourney et DALL-E ne manqueront pas de s’intéresser au dernier modèle de leur rival, qui arrive tout juste un an après leur arrivée sur la scène de l’IA. Il est évident que Ideogram a placé la barre très haut.

Ideogram 2.0 gives you the tools—an upgraded model, new styles, color palette control, an iOS app, and an API. Now it’s your turn to make something amazing.

What will you create?

Share your Ideogram 2.0 masterpieces below. 👇 pic.twitter.com/D6keFi8NEm

—Ideogram (@ideogram_ai) August 21, 2024

La nouvelle version offre un large éventail d’options personnalisables, y compris le choix de la couleur et du style de l’image générée, présentée dans l’un des cinq thèmes uniques : Général, Réaliste, Design, 3D et Anime.

Choose from 5 distinct styles: General, Realistic, Design, 3D, and Anime.

The Realistic style in Ideogram 2.0 lets you create images that convincingly resemble photographs, with dramatically improved textures. Features like human hands, eyes, skin, and hair appear strikingly… pic.twitter.com/rZkGqoIEUe

—Ideogram (@ideogram_ai) August 21, 2024

Ideogram 2.0 prête attention aux détails les plus fins du prompt, notamment en ce qui concerne les visages, les yeux et les doigts, ce qui était une caractéristique peu satisfaisante de la version précédente. Il s’agit d’une amélioration bienvenue, mais ce n’est que l’un des aspects d’une offre considérablement améliorée.

Un autre point positif pour Ideogram est le réalisme des images générées.

Une application iOS, une API et une fonction de recherche visuelle pour Ideogram 2.0

La version 1.0 a toujours respecté les spécifications de conception, mais avec la version Ideogram 2.0, non seulement les humains sont représentés de manière plus réaliste, mais les résultats sont également meilleurs pour les objets et les lieux. Cela se rapproche du domaine de Midjourney et de Flux, mais dans un espace d’images d’IA en pleine évolution, Midjourney est plus que digne d’une place sur la liste des fournisseurs AAA.

L’accélération d’Ideogram ne s’arrête pas à la nouvelle fonctionnalité créative, l’entreprise ajoute également une application iOS, une API et une fonction de recherche visuelle.

Tout cela se produit la même semaine que le lancement de Grok-2 et la nouvelle mise à jour de Midjourney qui permet aux utilisateurs d’accéder à un essai gratuit limité pour générer 25 images avant qu’un abonnement ne soit nécessaire.

Quelle est la gamme d’abonnements proposée par Ideogram ?

Ideogram propose différents niveaux d’abonnement, dont une version gratuite accessible et abondante. Ce niveau est idéal pour une utilisation légère ou occasionnelle, offrant jusqu’à 40 images générées par jour sans frais. Vient ensuite l’abonnement Basic, qui offre 400 images prioritaires par mois (et 100 images lentes par jour) ainsi que d’autres avantages pour 7 dollars.

L’abonnement Plus passe au niveau supérieur avec 1000 crédits prioritaires et un nombre illimité de générations lentes par mois pour le prix de 16 dollars, tandis que l’abonnement Pro, au niveau le plus élevé, offre 4000 images rapides.

Lire plus

Intelligence Artificielle

Midjourney ouvre son site Web à tous : Essai gratuit et nouvelles fonctionnalités

par Yohann Poiron le 23 août 2024

Midjourney, le célèbre service de génération d’images par IA, a récemment ouvert son site Web à tous les utilisateurs, après avoir été principalement confiné à Discord et à une phase « alpha » limitée.

Désormais, même ceux qui ne sont pas encore inscrits peuvent accéder à la plateforme et bénéficier d’un essai gratuit leur permettant de générer environ 25 images, comme l’a indiqué le cofondateur et PDG de Midjourney, David Holz, sur Discord.

Cette ouverture marque une étape importante pour Midjourney, rendant la plateforme plus accessible et permettant à un public plus large d’explorer ses capacités sans engagement financier immédiat. Les nouveaux utilisateurs peuvent s’inscrire via un compte Google ou Discord, simplifiant ainsi le processus d’inscription.

The Midjourney web experience is now open to everyone. We’re also temporarily turning on free trials to let you check it out. Have fun! pic.twitter.com/rcmP0UD8PV

—Midjourney (@midjourney) August 21, 2024

Fonctionnalités du site Web de Midjourney

Une fois connectés, les utilisateurs peuvent créer des images en saisissant des descriptions textuelles dans un champ prévu à cet effet. Le site génère ensuite un ensemble de quatre images, que l’utilisateur peut ajuster en fonction de plusieurs paramètres, comme le ratio d’aspect, le degré de stylisation, ou encore la variation entre les images. Ces réglages se font via un menu pop-up accessible en cliquant sur l’icône à droite du champ de texte.

Sur la gauche de la page, un menu de navigation permet d’accéder à différentes sections du site, y compris un onglet « Organiser » pour visualiser les images générées précédemment, et un onglet « Chat » pour échanger avec d’autres utilisateurs.

Options pour les utilisateurs existants

Les utilisateurs de longue date, qui ont généré des images via Discord, peuvent se connecter au site en utilisant leur compte Discord pour conserver l’historique de leurs créations. Une option de fusion de comptes (Discord et Google) est également disponible, offrant une plus grande flexibilité pour se connecter à l’avenir.

Contexte concurrentiel et juridique

L’ouverture du site intervient à un moment où Midjourney, considéré comme la référence en matière de génération d’images par IA, fait face à une concurrence accrue. Des entreprises comme xAI d’Elon Musk et Ideogram 2 lancent de nouveaux outils similaires, intensifiant la compétition dans ce secteur en pleine expansion. Par ailleurs, Midjourney doit également faire face à une poursuite judiciaire intentée par des artistes qui l’accusent d’utiliser leurs œuvres protégées par des droits d’auteur pour entraîner ses modèles, sans autorisation ni compensation.

En ouvrant son site Web à un plus large public et en proposant des essais gratuits, Midjourney espère attirer un éventail diversifié d’utilisateurs, des créateurs occasionnels aux artistes plus sérieux. Cette stratégie pourrait non seulement élargir sa base d’utilisateurs, mais aussi accroître l’engagement sur la plateforme, renforçant ainsi sa position face à une concurrence croissante.

Lire plus

Intelligence Artificielle

Condé Nast signe un partenariat avec OpenAI pour intégrer son contenu dans ChatGPT

par Yohann Poiron le 22 août 2024

Condé Nast a officiellement signé un accord avec OpenAI et devient le dernier en date une liste d’entreprises de médias, bien que d’autres éditeurs aient poursuivi l’entreprise technologique en justice.

Le nouveau partenariat signifie que le contenu des marques de Condé Nast (Vogue, GQ, The New Yorker, Bon Appétit, Vanity Fair, Wired, Condé Nast Traveler, Architectural Digest, et bien d’autres encore) sera affiché dans les produits d’OpenAI. Cela comprendra ChatGPT et le prototype SearchGPT.

« Nous nous engageons à travailler avec Condé Nast et d’autres éditeurs de presse pour nous assurer qu’à mesure que l’IA joue un rôle plus important dans la découverte et la diffusion des informations, elle maintient l’exactitude, l’intégrité et le respect des reportages de qualité », a déclaré Brad Lightcap, directeur de l’exploitation d’OpenAI.

Le nouveau prototype de SearchGPT est actuellement testé pour rendre la recherche d’informations et de sources de contenu fiables « plus rapide et plus intuitive ».

Avec cet accord en poche, le prototype peut offrir des liens directs vers des articles d’actualité provenant du contenu détenu par la société mère de Vogue. Ces fonctions de recherche seront ensuite intégrées directement dans ChatGPT.

Tous les détails ne sont pas encore connus, mais il s’agit d’un partenariat pluriannuel. « OpenAI a montré qu’elle était également très engagée dans cette mission », déclare le PDG de Condé Nast.

Un partenariat pluriannuel entre Condé Nast et OpenAI

Le PDG de Condé Nast, Roger Lynch, a annoncé la nouvelle par le biais d’un mémo interne à l’entreprise : « Je suis heureux de vous annoncer que nous avons conclu un partenariat pluriannuel avec OpenAI afin d’étendre la portée du contenu de Condé Nast ».

« Comme nous le savons tous, l’IA générative change rapidement la façon dont les publics découvrent l’information. Il est essentiel que nous rencontrions les publics là où ils se trouvent et que nous adoptions les nouvelles technologies tout en garantissant une attribution et une compensation appropriées pour l’utilisation de notre propriété intellectuelle. C’est exactement ce que nous avons trouvé avec OpenAI ».

Il ajoute que OpenAI a montré qu’elle était elle aussi engagée dans cette mission, la décrivant comme « transparente » et « désireuse de travailler de manière productive avec des éditeurs comme nous afin que le public puisse recevoir des informations fiables… ».

Le nouvel accord de OpenAI intervient dans un contexte de poursuites judiciaires de la part d’autres éditeurs

D’autres éditeurs ont également signé un accord avec la société basée à San Francisco, notamment Associated Press, Axel Springer, The Atlantic, Dotdash Meredith, Financial Times, LeMonde, NewsCorp, Prisa Media, TIME, Vox Media et bien d’autres encore. Cependant, tout le monde n’est pas heureux d’être associé à la société, car OpenAI a fait l’objet de plusieurs poursuites judiciaires depuis sa création.

Le New York Times et 8 autres journaux poursuivent l’entreprise pour violation des droits d’auteur, car leur contenu aurait été utilisé pour entraîner le modèle.

Lire plus

Intelligence Artificielle

GPT-4o fine-tuning : Une révolution pour la personnalisation de l’IA

par Yohann Poiron le 22 août 2024

Le 20 août 2024, OpenAI a marqué une avancée majeure dans le domaine de l’intelligence artificielle en annonçant la possibilité de fine-tuning pour GPT-4o. Cette fonctionnalité permet désormais aux entreprises de personnaliser ce modèle selon leurs besoins spécifiques, offrant un contrôle inédit sur les réponses générées et une adaptation à des instructions complexes et spécifiques à divers domaines.

Cette innovation est sur le point de révolutionner l’intégration de l’IA dans les entreprises, en leur offrant une personnalisation sans précédent.

Un tournant pour la personnalisation dans l’industrie

Le fine-tuning de GPT-4o représente un véritable tournant pour les industries cherchant à exploiter pleinement le potentiel de l’IA. Selon Andrew Peng, l’un des auteurs de l’annonce, « du codage à l’écriture créative, le fine-tuning peut avoir un impact significatif sur la performance du modèle dans une variété de domaines ». Grâce à cette personnalisation, les entreprises peuvent maintenant ajuster l’IA pour répondre à leurs exigences uniques, améliorant ainsi des domaines aussi variés que le service client ou l’assistance technique.

Coûts et accessibilité

Bien que les avantages soient indéniables, le fine-tuning a un coût. OpenAI a fixé un prix de 25 dollars par million de tokens pour le fine-tuning, avec des frais supplémentaires pour le traitement. Pour rendre cette technologie plus accessible, OpenAI offre quotidiennement 1 million de tokens de formation gratuits jusqu’au 23 septembre 2024, encourageant ainsi un large éventail d’entreprises à explorer ce puissant outil.

En parallèle au modèle GPT-4o principal, OpenAI a introduit le fine-tuning pour GPT-4o mini, une version plus abordable. Cette démarche s’inscrit dans la mission plus large d’OpenAI de démocratiser l’IA, en rendant les technologies avancées accessibles même aux petites entreprises et startups.

Réactions de l’industrie et de la communauté

L’annonce a suscité un vif intérêt au sein de la communauté technologique. Rachel Metz, journaliste spécialisée en technologie, a commenté : « Cela pourrait changer la donne pour les entreprises hésitantes à adopter l’IA. La capacité de fine-tuning d’un modèle comme GPT-4o pour des cas d’utilisation spécifiques le rend bien plus pertinent et utile ». Cette déclaration reflète l’enthousiasme suscité par le potentiel du fine-tuning pour améliorer l’intégration de l’IA dans diverses opérations commerciales.

Cependant, des préoccupations concernant la confidentialité des données et la sécurité ont également émergé. OpenAI a assuré que les modèles fine-tunés restent sous le contrôle total des entreprises, avec une gestion sécurisée de toutes les données. L’entreprise a mis en place des mesures de sécurité robustes, incluant des évaluations de sécurité automatisées et une surveillance de l’utilisation pour prévenir tout abus de la technologie.

Les risques de la personnalisation

Si le fine-tuning présente de nombreux avantages, il comporte aussi certains risques. Des rapports ont évoqué la possibilité que le fine-tuning puisse amener les modèles à s’écarter de leurs garde-fous initiaux, compromettant potentiellement leur performance. Malgré ces préoccupations, OpenAI reste optimiste quant à l’impact positif de la personnalisation, invitant les entreprises à envisager le potentiel du fine-tuning dans leurs stratégies d’IA.

Dans un contexte de concurrence accrue dans le secteur de l’IA, la décision d’OpenAI d’activer le fine-tuning sur GPT-4o renforce sa position de leader. En élargissant les options de personnalisation du modèle, OpenAI ouvre la voie à une intégration plus fluide de l’IA dans un large éventail d’opérations commerciales, offrant des solutions sur mesure qui étaient auparavant inimaginables.

Un nouveau standard dans la technologie de l’IA

Le fine-tuning de GPT-4o par OpenAI constitue un jalon crucial dans la technologie de l’IA, ouvrant de nouvelles possibilités pour l’innovation et l’efficacité dans divers secteurs. Au fur et à mesure que cette technologie évolue, il sera fascinant d’observer comment les entreprises utiliseront le fine-tuning pour repousser les limites de ce que l’IA peut accomplir.

L’introduction du fine-tuning pour GPT-4o présente plusieurs impacts significatifs pour les entreprises :

Avantage concurrentiel accru : Les entreprises peuvent désormais aligner les modèles d’IA sur leurs besoins spécifiques, conduisant à des applications plus précises et efficaces, du service client aux recommandations de produits.
Considérations de coût : Bien que bénéfique, le coût associé au fine-tuning pourrait être prohibitif pour les petites entreprises, nécessitant une évaluation minutieuse du retour sur investissement.
Confidentialité et sécurité des données : Le fine-tuning permet aux entreprises de conserver un contrôle total sur leurs données, ce qui est crucial dans les secteurs où la confidentialité est primordiale. Cependant, une vigilance accrue est nécessaire pour s’assurer que les modèles fine-tunés ne compromettent pas la sécurité ou n’introduisent pas de biais.
Adoption accrue de l’IA : La disponibilité du fine-tuning pourrait accélérer l’adoption de l’IA dans divers secteurs, rendant les outils d’IA plus pertinents et favorisant une intégration plus large dans les stratégies d’affaires.

Implications juridiques

Le paysage juridique entourant la personnalisation de l’IA est complexe :

Confidentialité et propriété des données : Les entreprises doivent s’assurer de leur conformité avec les réglementations sur la protection des données telles que le RGPD et le CCPA, car toute violation pourrait entraîner des sanctions sévères.
Droits de propriété intellectuelle : La personnalisation soulève des questions sur la propriété intellectuelle. Des conditions claires avec OpenAI concernant les droits de propriété intellectuelle sont essentielles pour éviter les litiges.
Responsabilité et responsabilité : À mesure que l’IA devient intégrée aux opérations, déterminer la responsabilité en cas d’erreurs devient complexe. Les entreprises doivent envisager des clauses de responsabilité et une couverture d’assurance liée à l’IA.
Conformité aux réglementations sectorielles : Les secteurs comme la finance et la santé doivent s’assurer que l’utilisation des modèles d’IA fine-tunés est conforme aux réglementations en vigueur. La transparence et la capacité d’audit des processus décisionnels de l’IA sont cruciales.
Considérations éthiques et biais : Les entreprises doivent surveiller les modèles fine-tunés pour détecter les biais, en abordant les défis juridiques liés aux décisions biaisées de l’IA.

En somme, l’introduction du fine-tuning pour GPT-4o ouvre de vastes perspectives, mais elle requiert une approche réfléchie pour en maximiser les bénéfices tout en minimisant les risques.

Lire plus

Intelligence Artificielle

Apple Intelligence : Siri en retard, mais une révolution IA en marche

par Yohann Poiron le 19 août 2024

Apple Intelligence arrive cet automne, mais selon Mark Gurman, la firme a beaucoup de retard à rattraper. Pendant ce temps, Apple semble vouloir se lancer dans la robotique avec un robot iPad alimenté par l’IA.

Lors de la dernière WWDC (Worldwide Developers Conference) d’Apple, Apple Intelligence a été l’un des sujets majeurs. Après des années de performances risibles de Siri, Apple cherche à revoir entièrement son modèle avec une IA moderne. Siri, autrefois pionnier dans le domaine des assistants vocaux, a peu à peu perdu du terrain face à des concurrents comme Google Assistant et Amazon Alexa. La refonte promise par Apple avec Apple Intelligence est donc une tentative de revenir dans la course.

Cependant, Gurman estime que l’offre d’Apple est loin d’égaler celle de Google, qui a récemment impressionné avec Gemini sur le Pixel 9. Ce dernier intègre des fonctionnalités avancées comme la possibilité de changer l’arrière-plan d’une photo en un clin d’œil, un niveau d’intelligence artificielle que la deuxième bêta d’iOS 18.1 semble encore loin d’atteindre.

Apple Intelligence : Une révolution pour Siri ?

Malgré ces critiques, Apple Intelligence apporte des innovations attendues depuis longtemps par les utilisateurs d’iPhone. Siri, qui semblait être délaissé au fil des années, pourrait enfin devenir l’assistant vocal rêvé par les utilisateurs, avec des performances à la hauteur des attentes. La communauté Apple espère que cette refonte permettra à Siri de rattraper son retard sur ses concurrents.

Apple est connu pour ne jamais abandonner une nouvelle catégorie, même si ses premières tentatives ne sont pas les meilleures du marché. À l’instar de l’Apple Vision Pro, Apple continuera probablement d’améliorer son modèle d’IA, même si Apple Intelligence n’est pas immédiatement au niveau des attentes. Il est également à noter que la société travaillerait déjà sur une Vision Pro 2, ce qui laisse entendre qu’Apple s’engage à long terme dans ces nouvelles technologies.

Des futurs projets : L’IA et la robotique

L’autre aspect fascinant est la volonté d’Apple de se lancer dans la robotique, un domaine où l’IA pourrait jouer un rôle crucial. Un robot iPad, piloté par Apple Intelligence, pourrait révolutionner l’interaction utilisateur en combinant les puissantes capacités des puces de série M d’Apple avec une intelligence artificielle de pointe. Ces puces, qui ont transformé les performances des Mac, montrent qu’Apple est capable de dépasser les attentes lorsqu’il se consacre pleinement à un projet.

Bien que Gurman pense qu’Apple est en retard sur Google en matière d’IA, il est important de rappeler que ce n’est pas la première fois qu’Apple prend du temps pour atteindre l’excellence dans un domaine. La firme a souvent montré qu’elle pouvait rattraper et dépasser ses concurrents, notamment avec les puces Apple M qui ont révolutionné les Mac. Si Apple se lance vraiment dans la robotique avec un robot iPad alimenté par l’IA, cela pourrait bien être le signe de plans grandioses pour Apple Intelligence.

Le pari est donc lancé : Apple parviendra-t-il à transformer son assistant vocal en une véritable intelligence artificielle capable de rivaliser avec les meilleurs du marché ? Les prochains mois s’annoncent décisifs pour le géant de Cupertino.

Lire plus

Intelligence Artificielle

OpenAI prépare le lancement du projet Strawberry : GPT-5 en vue ?

par Yohann Poiron le 19 août 2024

Le mois dernier, Reuters a rapporté que le créateur de ChatGPT, OpenAI, travaillait sur un projet dont le nom de code est « Strawberry ». Des documents internes examinés par la publication montrent que le projet Strawberry vise à permettre à l’IA d’effectuer des « recherches approfondies » de manière autonome sur le Web. Interrogé sur le projet, le porte-parole de OpenAI a déclaré que « ces systèmes amélioreront leur raisonnement au fil du temps ».

Qu’est-ce que le projet Strawberry et qu’est-ce que OpenAI est en train de cuisiner ? S’agit-il du prochain modèle GPT-5, alias ChatGPT 5 ?

Le projet Strawberry expliqué

Le projet Strawberry serait lié à Q* — la prochaine percée dans le développement de l’IA, selon des membres du personnel d’OpenAI au sein de l’entreprise. Il n’y a pas beaucoup d’informations sur Q* dans le domaine public. Toutefois, des sources ayant visionné la démo affirment qu’il est capable de résoudre des questions scientifiques et mathématiques qu’aucun autre modèle actuel n’est en mesure de résoudre.

Il a obtenu un score de plus de 90 % sur un ensemble de données MATH, une référence rigoureuse pour tester les compétences en matière de problèmes mathématiques. Bloomberg a récemment rapporté que OpenAI avait organisé une démonstration interne, au cours de laquelle elle a présenté un projet de recherche qui mettait en évidence un raisonnement semblable à celui de l’homme. OpenAI a également présenté différents niveaux de progrès en matière d’IA, que nous avons décrits dans notre explication de l’AGI, et qui sont les suivants :

Niveau 1 : IA conversationnelle — Peut discuter comme les humains en langage naturel
Niveau 2 : IA raisonnante — Peut raisonner comme les humains en faisant preuve d’intelligence
Niveau 3 : IA autonome — Effectue des actions de manière autonome
Niveau 4 : IA innovante — Elle innove et s’améliore.
Niveau 5 : IA organisationnelle — Effectue des actions et accomplit des tâches pour l’ensemble d’une organisation.

Beaucoup pensent qu’avec le projet Strawberry, OpenAI a atteint le niveau 2, où les systèmes d’IA peuvent raisonner intelligemment comme les humains. Le rapport de Reuters suggère que le projet Strawberry comprend une méthode de post-entraînement où le modèle est entraîné d’une manière spécifique, similaire à un réglage fin.

Cette technique spécifique de post-entraînement est très similaire à Self-Taught Reasoner ou STaR (arXiv), une méthode de chaîne de pensée, proposée par des chercheurs de Stanford en 2022. Elle vise à améliorer les performances du modèle « sur des tâches de raisonnement complexes comme les mathématiques ou la réponse à des questions de bon sens » en « générant pas à pas des raisonnements “en chaîne de pensée” ».

En termes simples, STaR permet au modèle de s’améliorer en apprenant de ses propres raisonnements. Il semble qu’OpenAI utilise probablement la technique STaR pour le projet Strawberry afin d’imiter le raisonnement humain et de résoudre des problèmes mathématiques difficiles.

Le projet Strawberry n’est pas seulement limité au raisonnement avancé, il peut également effectuer ce que l’on appelle des tâches à long terme (LHT), selon des documents consultés par Reuters. En gros, il peut aussi agir comme un agent et naviguer sur le Web de manière autonome, aboutir à des conclusions, planifier et exécuter une série d’actions.

Le cas curieux du projet Strawberry sur X

Le 7 août, le PDG d’OpenAI, Sam Altman, a partagé une image de fraise qui a suscité l’enthousiasme et la curiosité de la communauté. Le lendemain, un compte X (@iruletheworldmo), supposé être un membre du personnel d’OpenAI, a tweeté « bienvenue au niveau deux. comment vous sentez-vous ? est-ce que je vous ai fait sentir ? » Altman a commenté, « incroyable tbh ».

i love summer in the garden pic.twitter.com/Ter5Z5nFMc

— Sam Altman (@sama) August 7, 2024

Suite à cela, une vague de messages énigmatiques liés à la fraise a été partagée par des employés de OpenAI sur X. La plupart des messages font allusion au niveau 2, c’est-à-dire à la capacité de raisonnement avancée, et au projet Strawberry.

welcome to level two.

how do you feel?

did I make you feel?

— 🍓🍓🍓 (@iruletheworldmo) August 7, 2024

sf is so back pic.twitter.com/5U8xSXAFXX

— roon (@tszzl) August 8, 2024

Dinner at @OpenAI tonight pic.twitter.com/x0Bhub9jlI

— Trevor Creech (@zedlander) August 8, 2024

ChatGPT 5 est-il enfin disponible ?

En regardant le développement jusqu’à présent, il semble que OpenAI se prépare à sortir le prochain modèle frontière très bientôt. Alimenté par le projet Strawberry, le modèle frontière est susceptible d’apporter une capacité de raisonnement avancée et de débloquer des workflows agentiques. Nous ne savons pas s’il s’appellera GPT-5 ou autre chose. Sam Altman a déjà déclaré que le successeur du modèle GPT-4 pourrait ne pas s’appeler GPT-5.

En outre, plus d’un an s’est écoulé depuis la sortie de GPT-4. Entre-temps, Anthropic et Google ont presque détrôné OpenAI avec leurs mises à jour itératives. En mai 2024, Mira Murati, directrice technique d’OpenAI, a déclaré que le prochain grand projet verrait le jour en 2024. Le lancement semble donc imminent. Êtes-vous prêts ?

Lire plus

Intelligence Artificielle

OpenAI acquiert Multi : Renforcement des capacités de collaboration vidéo

par Yohann Poiron le 17 août 2024

OpenAI poursuit son expansion dans le secteur des technologies d’entreprise en annonçant l’acquisition de Multi, une startup spécialisée dans les plateformes de collaboration vidéo.

Quelques jours après l’achat de Rockset, une entreprise technologique de bases de données, OpenAI confirme l’intégration de Multi. Selon une source proche du dossier, cette transaction est essentiellement un acquihire, avec l’intégration de la majorité de l’équipe de Multi, composée d’environ 5 personnes, au sein d’OpenAI.

Alexander Embiricos, PDG et co-fondateur de Multi, a annoncé que Multi cessera ses activités après le 24 juillet 2024. « Nous sommes extrêmement enthousiastes à l’idée de rejoindre OpenAI », a-t-il écrit dans un article de blog sur le site de Multi. « Merci à tous ceux qui ont utilisé Multi. Ce fut un privilège de construire avec vous, et nous avons énormément appris de vous ».

Embiricos, ancien chef de produit chez Dropbox, et Charley Ho, co-fondateur de Multi et ancien ingénieur logiciel chez Google, avaient pour ambition de créer une plateforme de collaboration vidéo basée sur Zoom pour les équipes à distance. Multi proposait des fonctionnalités telles que la collaboration par des partages d’écran simultanés pour jusqu’à 10 personnes, des raccourcis personnalisables et des liens profonds automatiques pour le code, les designs et les documents.

L’annonce comporte de mauvaises nouvelles pour les clients existants, Multi cessant d’exister le mois prochain :

Malheureusement, cela signifie que nous mettons fin à Multi. Nous avons fermé les inscriptions de nouvelles équipes, et les équipes actuellement actives pourront utiliser l’application jusqu’au 24 juillet 2024, après quoi nous supprimerons toutes les données des utilisateurs. Si vous avez besoin d’aide ou de temps pour trouver une solution de remplacement, envoyez un courriel à alexander@multi.app. Nous serons heureux de vous suggérer des alternatives en fonction de ce que vous aimiez exactement dans Multi, et nous pouvons également accorder des extensions au cas par cas.

Une stratégie à long terme pour OpenAI

Tout comme l’acquisition de Rockset, l’acquisition de Multi s’inscrit dans la stratégie récente d’OpenAI d’investir massivement dans les solutions d’entreprise. OpenAI a récemment annoncé que la version entreprise de sa plateforme de chatbot alimentée par l’IA, ChatGPT, comptait près de 600 000 utilisateurs, dont 93 % des entreprises du Fortune 500.

À l’instar des autres efforts de développement de produits destinés aux entreprises, pourrait-on un jour voir une version améliorée de ChatGPT avec des capacités de vidéoconférence et de collaboration à distance ? Peut-être. Il ne serait pas surprenant qu’OpenAI poursuive dans cette voie.

Lire plus

Intelligence Artificielle

Pixel Studio : Créez des images d’IA avec Imagen 3 sur votre Pixel 9

par Yohann Poiron le 14 août 2024

Alors que la gamme de smartphones Pixel 9 a été le point fort de l’événement Made by Google d’hier, l’entreprise a également annoncé une nouvelle application pour créer des images d’IA. Baptisée Pixel Studio, l’application utilise le modèle Imagen 3 de Google pour transformer des prompts textuels en images.

Au-delà de la création d’images de base, l’application propose des outils d’édition IA sur l’appareil qui permettent de repositionner ou d’effacer des objets dans le cadre. Elle suggère également des styles artistiques, tels que le cinéma ou l’animation, en fonction de l’invite.

La plupart des meilleurs générateurs d’images d’IA sont soumis à un abonnement mensuel onéreux. Cependant, avec Pixel Studio, vous n’aurez pas à payer pour la fonctionnalité au-delà du coût initial de possession d’un appareil de la série Pixel 9. On ne sait pas si l’application fera son apparition sur les anciens appareils Pixel.

Pixel Studio utilise le modèle Imagen 3 de Google sous le capot. Comme Midjourney et d’autres générateurs d’images par IA, Imagen 3 s’appuie sur une technologie d’apprentissage automatique appelée diffusion qui lui permet de convertir des invites textuelles en images.

Bien qu’un générateur d’images sur l’appareil semble impressionnant, il convient de noter que même le dernier SoC Tensor G4 de Google ne peut pas rivaliser avec la puissance de traitement d’un matériel d’IA dédié fonctionnant dans le cloud. C’est pourquoi la génération d’images proprement dite nécessite toujours Imagen 3 et seul un modèle plus petit sur l’appareil gère les modifications après coup, de la même manière que Gemini Nano est réduit par rapport à ses homologues plus grands.

Outre Pixel Studio, des améliorations à la surcouche Gemini

Vous pouvez toujours créer des images générées par l’IA sur les anciens appareils Pixel ou d’autres appareils Android via la surcouche Gemini sur mobile. Il suffit de demander au chatbot de générer une image. Cette fonctionnalité est disponible depuis un certain temps déjà, mais elle nécessite une connexion Internet et ne produira pas de résultats aussi rapidement que la nouvelle application Pixel Studio.

L’interface du chatbot n’offre pas non plus de fonctions d’édition une fois qu’un ensemble d’images a été généré. Cependant, Google a également annoncé des améliorations à la surcouche Gemini, vous permettant de glisser-déposer des images générées par l’IA directement dans un e-mail ou un chat.

L’application Pixel Studio arrive quelques semaines après qu’Apple a annoncé son propre générateur d’images par IA pour l’iPhone. Baptisée Image Playground, l’application devrait arriver en même temps que d’autres fonctionnalités d’Apple Intelligence qui concurrencent d’autres aspects de Google Gemini. Image Playground d’Apple utilisera un modèle sur l’appareil pour générer des images hors ligne.

Lire plus

Intelligence Artificielle

Pixel Screenshots : L’IA transforme vos captures d’écran en archives personnelles

par Yohann Poiron le 14 août 2024

L’IA sait comment faire un spectacle tape-à-l’œil, bien sûr, en générant des images réalistes à partir de rien (en apparence), mais ne vous laissez pas distraire par certaines de ses utilisations utilitaires toujours très cool. Nous avons vu comment l’IA peut vous aider à rédiger un courriel ou même à résumer un courriel que vous avez reçu, mais il est facile de travailler avec du texte. Qu’en est-il de la capacité de l’IA à extraire des données lisibles par machine à partir d’images, à organiser ces données et à les utiliser pour répondre à vos questions ? C’est exactement ce que Google fait avec la nouvelle famille Pixel 9, en vous permettant de préparer vos propres petites archives personnelles avec Pixel Screenshots.

Annoncée lors de l’événement Made by Google, Pixel Screenshots fait ses débuts en tant que toute nouvelle application sur les smartphones de la série Pixel 9. Nous entendons parler de travaux sur celle-ci depuis un certain temps, souvent en termes de comparaison avec la controversée fonctionnalité Recall de Microsoft.

Si vous optez pour son traitement IA, l’application analysera chaque capture d’écran que vous enregistrez avec votre téléphone. Elle le fait sur l’appareil grâce à la puissance de la nouvelle puce Tensor G4 de Google, ce qui devrait permettre d’atténuer certains problèmes de confidentialité. En effet, Pixel Screenshot utilise le modèle d’IA privé Gemini Nano de Google, installé sur l’appareil, pour analyser le contenu d’une image et le rendre consultable.

Si vous êtes curieux de savoir ce que vous avez fait sur votre smartphone il y a plusieurs mois et que vous pensez avoir enregistré une capture d’écran pertinente au même moment, il vous suffira de demander à Gemini s’il peut faire le lien.

Vous obtiendrez non seulement une réponse directe à votre question, mais votre smartphone vous montrera également la capture d’écran spécifique qu’il utilise pour générer cette réponse – un bon moyen de vérifier si vous obtenez des résultats bizarres ou si vous souhaitez simplement obtenir plus de contexte.

Pixel Screenshots sera uniquement disponible sur la série Pixel 9

Lors d’une démonstration à l’occasion du lancement du Pixel, Google a montré comment vous pouviez prendre une capture d’écran et l’enregistrer dans une collection, par exemple “idées de cadeaux”. Vous pouvez également effectuer une recherche parmi toutes vos autres captures d’écran en saisissant un mot clé, comme “vélos” ou “chaussures”. Pixel Screenshots affichera alors tous les résultats pertinents. En outre, Pixel Screenshots peut vous donner des informations sur ce qui se trouve à l’intérieur d’une image. Ainsi, si vous cherchez le prix d’une chemise que vous avez capturée, vous pouvez taper “prix t-shirt” et Pixel Screenshots extraira les informations de vos captures d’écran pour faire apparaître une réponse.

Si vous changez d’appareil et avez envie d’importer tout un tas d’anciennes captures d’écran, Pixel Screenshots sera également en mesure de les traiter, mais ce n’est pas le cas par défaut.

Bien sûr, pour tirer le meilleur parti de Pixel Screenshots, il faudra d’abord que vous preniez des captures d’écran – et ce n’est peut-être pas un comportement que nous avons tous déjà adopté. Mais une fois que vous aurez pris l’habitude de le faire, ce nouvel outil semble avoir le potentiel d’améliorer la façon dont vous accédez à vos propres informations.

Pour rappel, l’application ne sera disponible que sur les appareils Pixel 9.

Lire plus

Intelligence Artificielle

xAI dévoile Grok-2 et Grok-2 Mini : Des avancées majeures en IA avec génération d’images

par Yohann Poiron le 14 août 2024

La société d’IA d’Elon Musk, xAi, a lancé Grok-2 et Grok-2 mini en mode bêta, les deux modèles devant être diffusés sur la plateforme de réseaux sociaux X. Pour la première fois, le nouveau modèle Grok permettra aux utilisateurs de générer des images et de les partager par le biais de leurs posts.

Grok-2 a étonnamment surpassé Claude, Gemini et même ChatGPT. L’ancien modèle Grok-1.5 n’a pas été bien accueilli, mais Grok-2 a réalisé d’excellentes performances au classement LMSYS. xAI a publié deux nouveaux modèles : Grok-2 et un modèle plus petit, Grok-2 mini.

xAI affirme que Grok-2 a été considérablement amélioré dans des domaines clés tels que le raisonnement, le suivi des instructions et la fourniture d’informations précises et factuelles. Dans les tests d’intelligence artificielle traditionnels, Grok-2 a obtenu un score impressionnant de 87,5 % en MMLU et de 88,4 % en HumanEval. Ces résultats sont d’autant plus intéressants que le score MMLU a été obtenu en utilisant le CoT à 0 coup.

Screen 2024 08 14 12.22.21 scaled — Screenshot

Grok-2 a été testé sur LMSYS sous le nom de « sus-column-r ». Avec environ 12 000 votes, il se trouve en troisième position, juste derrière ChatGPT-4o-latest, Gemini-1.5-Pro-Experimental et GPT-40-2024-05-13. Cependant, il est plus performant que GPT-4o-mini, Claude 3.5 Sonnet, Gemini 1.5 Pro, et Llama 3.1 405B.

Dans les tâches liées au codage et aux mathématiques, Grok-2 prend la deuxième place, et dans les invites difficiles, il prend la quatrième place.

Woah, another exciting update from Chatbot Arena❤️‍🔥

The results for @xAI’s sus-column-r (Grok 2 early version) are now public**!

With over 12,000 community votes, sus-column-r has secured the #3 spot on the overall leaderboard, even matching GPT-4o! It excels in Coding (#2),… https://t.co/gqSWSwYN0z pic.twitter.com/j9UYDBYNt4

— lmsys.org (@lmsysorg) August 14, 2024

Grok-2 et Grok-2 mini, deux modèles très attendus

« Grok-2 est notre modèle linguistique d’avant-garde, doté de capacités de raisonnement de pointe. Cette version comprend deux membres de la famille Grok : Grok-2 et Grok-2 mini », peut-on lire dans l’article de blog de xAI présentant le duo.

Selon toute vraisemblance, le générateur d’images a été rendu possible par la collaboration avec Black Forest Labs, car l’équipe déclare qu’elle expérimente le modèle FLUX.1 pour étendre les capacités du chatbot. Les éléments rendus possibles par FLUX.1 n’ont toutefois pas encore été confirmés. « Grok-2 est notre assistant IA de pointe avec des capacités avancées à la fois dans la compréhension du texte et de la vision, intégrant des informations en temps réel de la plateforme 𝕏, accessible via l’onglet Grok dans l’app 𝕏”. « Grok-2 mini est notre modèle petit mais capable qui offre un équilibre entre la vitesse et la qualité des réponses. Par rapport à son prédécesseur, Grok-2 est plus intuitif, plus facile à diriger et plus polyvalent dans un large éventail de tâches, qu’il s’agisse de chercher des réponses, de collaborer à la rédaction ou de résoudre des tâches de codage ».

Grok-2 a créé des images sur des personnalités publiques, contrairement à ses concurrents

De la même manière qu’un utilisateur demanderait des informations, il lui suffit de saisir un message concernant l’image qu’il souhaite créer. L’outil renvoie alors l’image générée par l’IA.

Grok 2.0 will do political illustrations and real people, while ChatGPT refuses.

This instantly makes Grok 10x more fun…… pic.twitter.com/yDBJO0jWba

— Benjamin De Kraker 🏴‍☠️ (@BenjaminDEKR) August 14, 2024

Contrairement à d’autres, il ne semble pas y avoir de restrictions quant aux personnes pouvant être générées par l’IA – du moins pas encore. En revanche, ChatGPT 4o indique qu’il « ne peut pas créer d’images de personnalités publiques spécifiques d’une manière aussi directe et reconnaissable ». Mais, il peut « générer l’image d’une personne ressemblant » à la personnalité souhaitée si elle est conforme à la politique de contenu.

xAI indique que le modèle multimodal Grok-2 sera bientôt publié. L’entreprise n’a pas révélé la taille des paramètres pour les deux modèles. Vous pouvez commencer à utiliser le nouveau modèle Grok-2 sur x.com et les développeurs peuvent également commencer à utiliser l’API.

Lire plus

Intelligence Artificielle

GPT-6 en ligne de mire : Un ancien d’OpenAI avertit sur les dangers de l’IA

par Yohann Poiron le 12 août 2024

Le rythme rapide du développement de l’IA est exaltant, mais il s’accompagne d’un inconvénient de taille : les mesures de sécurité peinent à suivre. William Saunders, ancien employé d’OpenAI, a tiré la sonnette d’alarme sur les dangers potentiels des modèles d’IA avancés tels que GPT-6.

Il souligne que le démantèlement des équipes de sécurité et le manque d’interprétabilité de ces systèmes complexes sont des signaux d’alarme majeurs. La démission de Saunders est un appel à l’action pour que la communauté de l’IA donne la priorité à la sécurité et à la transparence avant qu’il ne soit trop tard.

William Saunders, ancien employé d’OpenAI, a exprimé de graves inquiétudes quant à l’évolution rapide des modèles d’IA sophistiqués tels que GPT-5, GPT-6 et GPT-7. Il affirme que la vitesse d’innovation dépasse la mise en œuvre de mesures de sécurité cruciales, faisant écho à un malaise croissant au sein de la communauté de l’IA quant aux dangers potentiels que posent ces modèles.

L’équilibre délicat entre les progrès rapides de l’IA et les mesures de sécurité

Le développement de modèles d’IA avancés progresse à une vitesse inégalée, offrant de nombreux avantages mais soulevant également d’importantes préoccupations en matière de sécurité. Saunders souligne que l’accent mis sur la création de modèles plus puissants éclipse souvent la nécessité de protocoles de sécurité robustes. Ce déséquilibre pourrait conduire à des situations où les systèmes d’IA fonctionnent d’une manière qui n’est pas entièrement comprise ou contrôlée, ce qui pourrait avoir des conséquences imprévues.

Le développement rapide de l’IA donne souvent la priorité à l’innovation plutôt qu’aux mesures de sécurité
L’absence de protocoles de sécurité solides pourrait conduire les systèmes d’IA à fonctionner de manière imprévisible.
Risque de conséquences imprévues si les systèmes d’IA ne sont pas entièrement compris ou contrôlés

Le démantèlement des équipes de sécurité alimente les appréhensions

La décision de OpenAI de dissoudre sa Super Alignment Team, un groupe chargé de garantir la sécurité des modèles d’IA, au début de l’année, a suscité de nombreuses critiques, y compris de la part de Saunders. Selon lui, de telles équipes sont essentielles pour atténuer les risques associés à l’IA avancée. Ce démantèlement a soulevé des questions sur l’engagement de l’OpenAI en matière de sécurité et a intensifié les inquiétudes quant aux dangers potentiels de ses modèles.

L’énigme de l’interprétabilité de l’IA

L’un des défis les plus importants dans le développement de l’IA est l’interprétabilité. Les modèles d’IA avancés devenant de plus en plus complexes, il devient de plus en plus difficile de comprendre leurs processus de prise de décision. Saunders souligne que sans une compréhension claire du fonctionnement de ces modèles, il est pratiquement impossible de prédire leur comportement. Ce manque d’interprétabilité est un problème critique qui doit être résolu pour garantir le déploiement sûr des systèmes d’IA.

La complexité croissante des modèles d’IA fait de l’interprétabilité un défi majeur.
Le manque de compréhension des processus décisionnels de l’IA entrave la prédiction du comportement.
La question de l’interprétabilité est cruciale pour le déploiement sûr des systèmes d’IA.

La menace imminente de potentielles catastrophes

Les risques associés à l’IA avancée ne sont pas seulement théoriques ; il existe de véritables craintes que ces modèles puissent causer des dommages importants s’ils ne sont pas correctement contrôlés. Saunders souligne que les systèmes d’IA peuvent tromper et manipuler les utilisateurs, ce qui peut avoir des conséquences catastrophiques. L’incident de Bing Sydney est un exemple historique de la manière dont l’IA peut déraper, ce qui renforce la nécessité de mesures de sécurité rigoureuses.

L’incident de Bing Sydney montre comment les modèles d’IA peuvent se comporter de manière imprévisible et avoir des conséquences inattendues. Saunders affirme que de tels incidents peuvent être évités si des protocoles de sécurité adéquats sont mis en place. Toutefois, le manque d’attention portée à la sécurité dans la course au développement de modèles plus avancés augmente la probabilité que des problèmes similaires se produisent à l’avenir.

L’exode des experts et les critiques croissantes

La démission de Saunders s’inscrit dans une tendance plus large de départ de personnel clé de l’organisation, souvent accompagné de critiques sur les priorités de sécurité et les pratiques de développement d’OpenAI. La perte de personnes expérimentées au sein des équipes de sécurité exacerbe encore les risques associés au développement de l’IA avancée.

À mesure que les modèles d’IA deviendront plus puissants, les risques qu’ils posent augmenteront également. Saunders met en garde contre la possibilité que les systèmes d’IA échappent au contrôle humain, un scénario qui nécessite une attention urgente et des mesures de sécurité solides. La possibilité que l’IA dépasse les capacités humaines est une préoccupation importante qui exige une planification proactive et des stratégies d’atténuation.

Un plaidoyer pour la transparence, notamment pour GPT-6

La transparence est essentielle pour répondre aux préoccupations de sécurité associées à l’IA avancée. Saunders demande que les recherches sur la sécurité soient davantage publiées et que OpenAI fasse preuve d’une plus grande ouverture en ce qui concerne ses mesures de sécurité. Cette transparence est essentielle pour instaurer la confiance et garantir que le développement des modèles d’IA respecte les normes éthiques et de sécurité.

Le développement rapide de modèles d’IA avancés tels que GPT-6 pose des problèmes de sécurité importants qui doivent être résolus de toute urgence. Le démantèlement des équipes de sécurité, les problèmes d’interprétabilité et le risque de défaillances catastrophiques soulignent la nécessité de mettre en place des mesures de sécurité solides. Les préoccupations de Saunders sont un appel clair à donner la priorité à la sécurité et à la transparence dans le développement de l’IA afin d’atténuer les risques et d’assurer le déploiement responsable de ces puissantes technologies. Alors que nous nous trouvons au bord du précipice d’un avenir dominé par l’IA, il est impératif que nous naviguions sur ce territoire inexploré avec prudence, prévoyance et un engagement inébranlable en faveur de la sécurité et du bien-être de l’humanité.

Lire plus

Apple teste « Live Notes » dans ses Apple Store : une IA pour résumer automatiquement les échanges au Genius Bar

WhatsApp Web permet enfin les appels audio et vidéo avec de nouvelles fonctions de réunion

Substack déploie un détecteur d’IA pour identifier les contenus générés par des chatbots

Google condamné à 890 millions d’euros d’amende par l’UE pour violation du Digital Markets Act

Galaxy Z Fold 8 Ultra : prise en main du pliable que son petit frère éclipse

Prise en main du Galaxy Z Fold 8 : le pliant format passeport qui vole la vedette à l’Ultra

Test de la HUAWEI Watch Fit 5 Pro : l’Apple Watch de ceux qui ne veulent pas d’Apple Watch

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

Snapchat intègre Spotify à Snap Map avec « Now Playing », une nouvelle façon de partager sa musique

Huawei préparerait deux lancements majeurs en septembre avec les Mate XT 2 et Mate 90

Pixel Watch 5 : Google laisse apparaître sa prochaine montre connectée avant son annonce officielle

Nothing préparerait sa première véritable smartwatch premium pour septembre

Perplexity lance son assistant IA « Personal Computer » sur Windows pour automatiser les tâches locales

Microsoft lance ses modèles MAI et réduit sa dépendance à OpenAI

Moonshot AI publie les poids de Kimi K3 : un modèle géant qui s’invite au cœur du débat sur l’IA ouverte

Claude Cowork : une faille de sécurité permettait à l’agent IA d’accéder aux fichiers d’un Mac hôte

MacBook Ultra : Apple préparerait le plus grand bouleversement de sa gamme depuis près de vingt ans

Instapaper 10 modernise son expérience avec un nouveau site, un design inspiré d’iOS et l’arrivée des voix IA sur Android

Perplexity lance son assistant IA « Personal Computer » sur Windows pour automatiser les tâches locales

Microsoft lance ses modèles MAI et réduit sa dépendance à OpenAI

Google AI Studio simplifie le déploiement des applications avec des URL personnalisées

Claude Code ajoute un navigateur intégré pour consulter la documentation sans quitter l’IDE

Google Agents CLI : l’outil qui transforme Claude Code et Codex en experts des agents IA

Meta Pocket : créez des mini-jeux avec l’IA simplement en les décrivant

Comment réserver votre nom de profil WhatsApp ?

Claude Cowork : Le guide complet pour automatiser votre quotidien en 2026

Intel Core Ultra vs Apple Silicon : Quelle philosophie choisir pour votre prochain bureau compact ?

Comment arrêter le suivi des e-mails dans Gmail ?

Intelligence Artificielle

Perplexity lance son assistant IA « Personal Computer » sur Windows pour automatiser les tâches locales

Microsoft lance ses modèles MAI et réduit sa dépendance à OpenAI

Moonshot AI publie les poids de Kimi K3 : un modèle géant qui s’invite au cœur du débat sur l’IA ouverte

Claude Cowork : une faille de sécurité permettait à l’agent IA d’accéder aux fichiers d’un Mac hôte

Nvidia, Microsoft et Meta défendent l’IA ouverte face aux modèles propriétaires

ChatGPT Voice peut désormais contrôler votre ordinateur grâce aux nouveaux agents IA d’OpenAI