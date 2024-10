Anthropic a dévoilé des mises à jour majeures pour son modèle d’IA Claude 3.5, avec une version améliorée de Claude 3.5 Sonnet et l’introduction du Claude 3.5 Haiku, un modèle plus léger mais tout aussi performant. Ces améliorations visent à renforcer les capacités de l’IA, en particulier pour les tâches de codage, tout en intégrant de nouvelles fonctionnalités expérimentales qui repoussent les limites de l’interaction entre l’IA et l’utilisateur.

Mais le développement le plus marquant de cette version est une nouvelle fonctionnalité : Claude peut désormais utiliser un ordinateur comme un humain, naviguer sur les écrans, cliquer sur des boutons et saisir du texte.

Claude 3.5 Sonnet : leader en performance pour le codage et bien plus

Déjà reconnu pour son excellence dans le codage, le nouveau Claude 3.5 Sonnet montre désormais des performances encore meilleures dans divers benchmarks. Anthropic affirme que cette version améliorée surpasse des concurrents tels que Gemini 1.5 et GPT-4o dans plusieurs catégories, à l’exception du test MATH, où Gemini 1.5 Pro conserve une légère avance.

Claude 3.5 Sonnet est particulièrement efficace pour gérer des tâches de codage complexes, en faisant un outil précieux pour les développeurs. Avec ces améliorations significatives, Sonnet se positionne comme un leader de la performance, et grâce à l’introduction de nouvelles fonctionnalités, il devient encore plus polyvalent.

Claude 3.5 Haiku: petit mais puissant

Malgré sa taille réduite, Claude 3.5 Haiku dépasse les performances de Claude 3.0 Opus, le plus grand modèle de la génération précédente d’Anthropic. Prévu pour sortir plus tard ce mois-ci, Haiku affiche d’excellents résultats en codage, avec un score de 40,6 % sur le test SWE-bench Verified, surpassant à la fois GPT-4o et la version originale de Sonnet.

Ce modèle compact offre des performances puissantes tout en restant léger.

Nouvelle fonctionnalité expérimentale : l’API « Computer Use »

L’une des innovations les plus révolutionnaires est l’introduction de l’API « Computer Use » dans Claude 3.5 Sonnet, actuellement en bêta publique. Cette fonctionnalité pourrait avoir des répercussions considérables pour les secteurs qui s’appuient sur des tâches répétitives impliquant plusieurs applications et onglets.

Cette API permet à Claude d’interagir avec des applications de bureau en générant des frappes au clavier, des mouvements de souris et des clics, imitant ainsi l’interaction humaine avec les logiciels. De la saisie de données à la recherche en passant par le service client, les potentielles applications sont vastes et peuvent potentiellement façonner le secteur.

Bien que toujours à l’état expérimental, cette fonctionnalité ouvre la voie à l’automatisation de diverses tâches, comme naviguer sur des sites Web ou remplir des formulaires via des logiciels spécifiques.

Anthropic explique que Claude peut désormais observer ce qui s’affiche à l’écran et utiliser des outils logiciels en fonction du positionnement des pixels. Cela en fait un agent IA capable d’exécuter des processus logiciels. Cette fonctionnalité est déjà testée par des entreprises comme Asana, Canva, Cognition, DoorDash, Replit et The Browser Company. Par exemple, Replit utilise cette technologie pour évaluer des applications en cours de développement.

Une nouvelle ère pour la bureautique ?

À court terme, les entreprises pourraient constater des gains de productivité immédiats dans des domaines tels que la saisie de données, le service client et le support informatique. Mais à mesure que la technologie mûrit, les applications potentielles pourraient s’étendre bien au-delà de ces cas d’utilisation initiaux.

Imaginez un monde dans lequel l’IA gère des processus juridiques complexes, de la révision des contrats à la saisie des formulaires de conformité. Ou imaginez que l’IA aide les médecins à parcourir les dossiers médicaux électroniques et à diagnostiquer les patients en recoupant les bases de données médicales.

La nouvelle fonctionnalité « Utilisation de l’ordinateur » de Claude nous rapproche d’un avenir où l’IA pourra effectuer une large gamme de tâches couvrant différentes applications logicielles et systèmes. Cela lui confère un niveau de flexibilité jusqu’alors inimaginable pour les technologies d’IA, qui se limitaient souvent à des tâches spécifiques et restreintes.

Contrôle de l’IA sous supervision humaine

Malgré les capacités avancées de Claude 3.5 Sonnet, Anthropic assure que le contrôle humain reste essentiel. Les utilisateurs fournissent des instructions spécifiques pour guider les actions de Claude, comme demander à l’IA de remplir des formulaires ou d’accomplir des tâches en utilisant des données de l’ordinateur. L’IA traduit ces instructions en commandes précises (comme déplacer le curseur ou taper sur le clavier).

Anthropic a également mis en place des mesures de sécurité, reconnaissant les potentiels risques de mauvais usage, comme la génération de spam ou la fraude. Pour y remédier, la société a développé des classificateurs qui détectent tout usage inapproprié de l’API, assurant que la technologie est utilisée de manière éthique.

Avec le lancement de Claude 3.5 Sonnet et Claude 3.5 Haiku, Anthropic continue de faire progresser l’IA générative. Ces nouveaux modèles surpassent non seulement leurs prédécesseurs, mais introduisent également des fonctionnalités innovantes comme le contrôle informatique, permettant une intégration plus poussée avec les systèmes logiciels. Alors que de plus en plus d’entreprises adoptent ces outils, le potentiel d’automatisation et d’interaction assistée par l’IA augmente, bien qu’Anthropic reste vigilant quant à l’usage éthique et sécurisé de cette technologie.

Alors que des entreprises comme GitLab, Canva et Replit explorent déjà son potentiel, il est clair que l’IA est sur le point de jouer un rôle encore plus important dans l’avenir du travail, peut-être plus tôt que nous ne le pensons.