Avant-hier, Google a lancé sa réponse très attendue à ChatGPT d’OpenAI (la première version de Bard ne comptait pas vraiment, n’est-ce pas ?). Toutefois, le nouvel ensemble de modèles d’IA générative que Google appelle « le début de l’ère Gemini » ne sera pas encore disponible en Europe, en raison d’obstacles réglementaires.

Le géant de la technologie qualifie Gemini de « modèle le plus performant à ce jour » et affirme qu’il a été formé pour reconnaître, comprendre et combiner différents types d’informations, notamment du texte, des images, du son, de la vidéo et du code.

Selon Demis Hassabis, PDG de Google DeepMind, ce modèle est aussi performant que les meilleurs experts humains dans les 50 domaines différents sur lesquels il a été testé. En outre, il a obtenu un score de plus de 90 % sur les critères de référence de l’industrie pour les Large Language Model (LLM).

Les modèles de la famille Gemini seront disponibles en trois tailles. Gemini Ultra est le plus grand (mais aussi le plus lent), destiné à effectuer des tâches très complexes ; Gemini Pro est le plus performant pour un large éventail de tâches ; et Gemini Nano pour les tâches sur l’appareil.

Google affirme avoir entraîné Gemini 1.0 sur son infrastructure optimisée pour l’IA en utilisant les unités de traitement Tensor (TPU) v4 et v5e de l’entreprise. Parallèlement à la présentation de la famille Gemini, Google a également annoncé la Cloud TPU v5p, spécialement conçue pour l’entraînement de modèles d’IA de pointe.

Le Nano, optimisé pour les appareils mobiles, représente peut-être une véritable évolution dans l’application du LLM. En effet, Nano permettra aux développeurs de créer des applications d’IA qui peuvent également fonctionner hors ligne — avec les avantages supplémentaires d’options améliorées en matière de confidentialité des données.

Expliqué plus en détail par l’entreprise dans un article de blog, Google fournit également l’AI Studio, un outil de développement gratuit basé sur le Web qui permet de créer des prototypes et de lancer des applications à l’aide d’une clé API. Gemini Pro sera mis à la disposition des développeurs et des entreprises clientes à partir du 13 décembre.

Comme pour Bard, l’Europe devra attendre pour Gemini Pro

Une version « affinée » de Gemini Pro a été lancée pour le chatbot Bard de Google dans 170 pays et territoires. L’entreprise précise qu’elle sera également disponible pour d’autres de ses services, tels que Recherche, Adsense et Chrome, dans les mois à venir.

Toutefois, les utilisateurs de l’UE et du Royaume-Uni désireux de tester la « nouvelle ère » de l’IA de Google devront attendre un peu plus longtemps. Google n’a pas donné de détails détaillés, mais a indiqué qu’il prévoyait « d’étendre l’application à différentes modalités et de prendre en charge de nouvelles langues et de nouveaux lieux dans un avenir proche ».

En effet, Google prévoirait de présenter en avant-première, l’année prochaine, « Bard Advanced », alimenté par le système multimodal Gemini Ultra. Google a lancé Bard en mars 2023, mais en raison de problèmes de conformité avec le RGPD, les utilisateurs européens n’ont pu l’utiliser qu’en juin. Voyons combien de temps nous devrons attendre pour Gemini.