Lors de l’événement Cloud Next, Google a annoncé une mise à jour significative pour son modèle d’intelligence artificielle, Gemini 1.5 Pro. Annoncé pour la première fois en février, ce modèle est désormais disponible en preview public et se distingue par sa faculté à analyser non seulement le texte et les images, mais aussi l’audio et la vidéo.

Ainsi, cette nouvelle version permet désormais au modèle d’écouter des fichiers audio et d’en extraire des informations, ce qui est particulièrement utile pour analyser des appels de résultats ou des contenus audiovisuels sans nécessiter de transcription écrite.

Gemini 1.5 Pro, décrit comme le modèle intermédiaire de la gamme Gemini, se distingue en surpassant en performances Gemini Ultra, le modèle le plus avancé jusqu’à présent. Cette version améliorée de Gemini élimine le besoin de personnalisation fine des modèles, simplifiant son utilisation.

Ce développement marque une avancée majeure pour l’IA de Google, permettant une analyse intermodale fluide. Les utilisateurs peuvent désormais obtenir des transcriptions de haute qualité et effectuer des recherches dans le contenu audio et vidéo, ce qui est particulièrement utile pour parcourir des appels de résultats ou des réunions d’investisseurs.

Google affirme que Gemini 1.5 Pro surpasse Gemini 1.0 Pro dans 87 % des benchmarks et rivalise presque avec Gemini 1.0 Ultra. Le modèle est capable de traiter 1 heure de vidéo, 11 heures d’audio, des bases de code de plus de 30 000 lignes, ou plus de 700 000 mots en un seul flux, soulignant ainsi sa puissance et sa polyvalence, ce qui est 4x plus que le modèle phare de Anthropic, Claude 3, et 8x plus que le contexte maximal de GPT-4 Turbo d’OpenAI.

Cette fenêtre de contexte élargie permet à Gemini 1.5 Pro de mieux suivre le flux narratif des données, de générer des réponses plus riches en contexte et de réduire le besoin de peaufinage et d’ancrage factuel.

Gemini 1.5 Pro exclusif Vertex AI

Cependant, l’accès à Gemini 1.5 Pro est exclusif aux utilisateurs de Vertex AI, la plateforme de développement d’applications IA de Google. La plupart des utilisateurs connaissent les modèles Gemini à travers le chatbot Gemini, avec Gemini Ultra alimentant la version avancée de ce chatbot.

Google a également révélé que Gemini 1.5 Pro commencerait à intégrer d’autres produits de son écosystème d’entreprise, notamment Code Assist, son outil d’assistance à la programmation générative. Les développeurs pourront effectuer des modifications « à grande échelle » dans les bases de code, par exemple en mettant à jour les dépendances entre fichiers et en révisant de grands blocs de code.

D’autres nouveautés annoncées

Outre Gemini, Imagen 2, le modèle de génération d’images de Google, a également été mis à jour pour inclure les fonctionnalités d’inpainting et d’outpainting, permettant aux utilisateurs de modifier les images plus librement. Google a aussi intégré la fonctionnalité de watermarking digital SynthID à toutes les images créées par les modèles Imagen, qui ajoute un filigrane invisible détectable par des outils spécifiques, garantissant l’origine des images.

En parallèle, Google explore une intégration de ses réponses d’IA avec Google Recherche pour fournir des informations actualisées, répondant à un besoin crucial d’informations à jour, notamment écartées délibérément parfois, comme pour les questions relatives aux élections américaines de 2024.

YouTube explore les publicités sur vidéos en pause : Plus de pubs pour tous

Windows 11 durcit ses exigences : Fin de support pour les anciens processeurs

Microsoft ouvre le code source de MS-DOS 4.0: Un trésor pour les historiens du numérique

La Nintendo Switch 2 pourrait être équipée de Joy-Con magnétiques

Test des Nothing ear (a) : Performance premium à petit prix

Test de la Garmin Forerunner 165 : La montre de sport abordable pour 2024

Découverte de Google Gemini : l’assistant IA qui comprend vraiment

Test de la Navee S65C : une conduite urbaine et tout-terrain sans compromis

WhatsApp innove : Introduction des discussions favoris pour iOS et Android

OnePlus Nord 4 et Nord CE4 Lite : les principales caractéristiques ont été divulguées

Le Apple Pencil 3 promet une révolution créative avec feedback haptique

Les Nothing ear et ear (a) : mode transparence amélioré par une mise à jour

Révolutionnez votre montage vidéo avec ces 5 outils IA incontournables

Beats Solo 4 et Solo Buds : Nouveautés Apple pour les amateurs d’audio

OpenAI demande le rejet des poursuites engagées par Elon Musk

Microsoft Store introduit un installateur autonome pour une installation épurée

Découvrez GitLab Duo Chat : l’IA au service du développement logiciel

L’IA transforme le développement : 3/4 des développeurs l’utiliseront en 2028

Maximiser le développement avec ChatGPT : Conseils et limites

Google dévoile Gemini Code Assist : Une révolution IA pour les développeurs

Instagram propose un jeu d’emoji caché, voici comment y jouer

Les secrets du sommeil : comment la qualité du repos influence l’espérance de vie

9 outils d’IA pour vous aider à organiser votre vie en 2024

Optimisez votre MacBook : Guide des meilleures astuces de productivité

Gemini 1.5 Pro : Google étend les capacités d’IA à l’audio et à la vidéo

Gemini 1.5 Pro exclusif Vertex AI

D’autres nouveautés annoncées

The author Yohann Poiron

vous pourriez aussi aimer