L’industrie de la technologie assiste avec intérêt aux préparatifs d’OpenAI pour son événement de lundi, où la société pourrait dévoiler une avancée significative avec un nouveau modèle d’IA multimodal.

On assiste à des spéculations croissantes autour de OpenAI, la société derrière ChatGPT, qui pourrait révolutionner son offre avec un assistant numérique multimodal. Ce développement, contrairement aux rumeurs antérieures, ne pointerait pas vers un moteur de recherche classique, mais vers une innovation pouvant toujours remettre en question la suprématie de Google.

L’assistant multimodal envisagé serait capable de traiter divers types d’entrées, pas seulement du texte. Selon un rapport de The Information, ce modèle serait capable de reconnaître les objets et de comprendre la parole, offrant une interprétation plus rapide et plus précise des images et des sons que les modèles actuels de transcription et de synthèse vocale.

Cette capacité permettrait, par exemple, d’analyser des informations visuelles via une caméra et de fournir des réponses audibles, enrichissant l’interaction avec l’utilisateur. Imaginez pointer votre caméra vers un panneau dans une langue étrangère, demander à ChatGPT d’identifier et de traduire le texte, puis recevoir une réponse vocale.

Cette fonctionnalité ressemble à ce que proposent déjà des outils comme Google Lens et Google Assistant, et même le récent Google Gemini. Néanmoins, la promesse d’OpenAI semble intégrer ces capacités dans une interface unique, renforçant l’efficacité et l’accessibilité.

Rendez-vous ce soir à 19 heures pour les annonces OpenAI

Les sources anonymes citées par The Information soulignent que cette IA pourrait non seulement améliorer l’efficacité des agents de service client en analysant l’intonation ou le sarcasme des appelants, mais également aider les étudiants avec les mathématiques ou traduire des panneaux en temps réel. Bien que le nouveau modèle puisse surpasser GPT-4 Turbo dans certains types de réponses, il reste sujet à l’erreur, parfois avec une grande assurance.

Ce lundi, lors de l’événement prévu, il est probable que l’entreprise dévoile un modèle GPT amélioré, bien que ce ne soit pas le GPT-5 tant attendu, attendu seulement pour fin 2024.

We’ll be streaming live on https://t.co/OcO6MLUYGH at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.

— OpenAI (@OpenAI) May 10, 2024

Le timing de cet événement est stratégique, se déroulant juste avant la Google I/O, où Google devrait révéler ses propres avancées en IA. Ce rendez-vous d’OpenAI, fixé ce lundi 13 mai à 19 heures, heure de Paris, pourrait non seulement ébranler la dominance de Google mais aussi ajuster les attentes du marché sur les capacités évolutives de l’IA en interaction directe avec les utilisateurs.

X (Twitter) : Un bouton « Je n’aime pas » en phase de test

Après 41 ans, Bloc-notes de Windows 11 accueille le correcteur orthographique et l’autocorrection

Google élargit le rapport sur le dark web à tous les comptes

Ajustements de tarifs pour le Xbox Game Pass et nouvelle formule Standard dévoilée

Test de la Honor Pad 9 : Un équilibre idéal entre performance et prix

Test du Samsung Galaxy S24 : 6 mois plus tard, est-il toujours intéressant ?

Test des Nothing ear : L’Innovation audio sans compromis

Test de la DJI Power 1000 : Chargez tous vos appareils avec style et efficacité

1,46 milliard d’utilisateurs iPhone visés par une attaque de phishing, comment vous protéger ?

WhatsApp uniformise ses badges de vérification : Du vert au bleu

MediaTek devance Qualcomm avec une hausse de 53% des expéditions de smartphones 5G

Galaxy Z Flip 6 Olympic Edition : Le smartphone exclu des Jeux Olympiques 2024

Thrive AI Health : Vers un coach de santé IA pour réduire les maladies chroniques

Samsung confirme que son casque XR sera disponible cette année !

Apple et Microsoft prennent du recul par rapport à OpenAI

Galaxy AI : de nouvelles fonctionnalités dédiées aux Galaxy Z Flip 6 et Z Fold 6

L’assistant de codage IA Pieces, une alternative à GitHub Copilot

Figma désactive son outil Make Design après accusations de plagiat

Apple admet que 8 Go de RAM ne suffisent plus pour certaines fonctions

Figma lance des fonctionnalités IA pour révolutionner le design de produits

Comment obtenir le nouveau Windows Copilot sur n’importe quel appareil ?

Comment refuser que ChatGPT utilise vos chats pour former ses modèles ?

Comment obtenir et utiliser l’application ChatGPT pour macOS ?

Slack vs Teams : Quelle application de discussion instantanée choisir ?

OpenAI prévoit de lancer un assistant numérique multimodal révolutionnaire

Rendez-vous ce soir à 19 heures pour les annonces OpenAI

L’iPhone 16 Pro promet une luminosité améliorée et des innovations majeures

Lancement repoussé de la GoPro Max 2 face à la conquête de Insta360

The author Yohann Poiron

OpenAI prévoit de lancer un assistant numérique multimodal révolutionnaire

Rendez-vous ce soir à 19 heures pour les annonces OpenAI

The author Yohann Poiron

vous pourriez aussi aimer