Parallèlement au lancement du nouveau modèle Gemini 1.5 Pro, Google a également présenté un nouveau modèle appelé Gemini 1.5 Flash lors de l’événement Google I/O 2024. Il s’agit d’un modèle léger conçu pour la vitesse et l’efficacité.

Il dispose également de toutes les fonctionnalités de raisonnement multimodal et d’une grande fenêtre contextuelle d’un million de jetons, comme le modèle Pro.

Le modèle Gemini 1,5 Flash a été développé pour les tâches où la faible latence et l’efficacité sont les plus importantes. Il s’agit d’un modèle plus petit, similaire au modèle Haiku d’Anthropic, mais qui bénéficie de toutes les dernières avancées. Google n’a pas révélé la taille des paramètres du modèle Gemini 1.5 Flash.

Si vous souhaitez tester le modèle Gemini 1.5 Flash, vous pouvez vous rendre sur le site Google AI Studio et commencer à tester le modèle immédiatement. Il n’y a pas de liste d’attente pour accéder au modèle et il est disponible dans plus de 200 pays à travers le monde. Les développeurs et les entreprises clientes peuvent également accéder au modèle Flash sur Vertex AI.

Le modèle Gemini 1,5 Flash devrait être beaucoup plus puissant que d’autres modèles plus petits comme Google Gemma, Mistral 7B, Phi-3, etc. Il s’agit d’un modèle multimodal natif qui peut traiter du texte, des fichiers audio, des images et des vidéos. Ce nouveau petit modèle de langage a été révélé 24 heures après que l’un des principaux concurrents de Google en matière d’IA, OpenAI, a dévoilé GPT-4o, un LLM multimodal qui sera disponible pour tous les utilisateurs et comprendra une application de bureau.

Outre Gemini 1.5 Flash, Gemini 1.5 Pro passe à deux millions de tokens

Mais ce n’est pas la seule nouveauté concernant Gemini. Gemini 1.5 Pro, qui a fait ses débuts en février, bénéficie d’une fenêtre contextuelle élargie, passant de 1 million de tokens à 2 tokens. Les développeurs intéressés par cette mise à jour devront s’inscrire sur la liste d’attente.

Il existe quelques différences notables entre Gemini 1.5 Flash et Gemini 1.5 Pro. Le premier est destiné à ceux qui se soucient de la vitesse de sortie, tandis que le second a plus de poids et a des performances analogues à celles du grand modèle 1.0 Ultra de Google. Josh Woodward, vice-président de Google Labs, souligne que les développeurs devraient utiliser Gemini 1.5 Flash s’ils cherchent à effectuer des tâches rapides pour lesquelles une faible latence est importante. En revanche, il explique que Gemini 1.5 Pro est destiné aux « tâches de raisonnement plus générales ou complexes, souvent à plusieurs étapes ».

Les modèles de Google couvrent toute la gamme, du plus léger avec Gemma et Gemma 2 à Gemini Nano, Gemini 1,5 Flash, Gemini 1.5 Pro et Gemini 1.0 Ultra. « Les développeurs peuvent passer d’une taille à l’autre en fonction du cas d’utilisation. C’est pourquoi il dispose des mêmes capacités de saisie multimodale, du même contexte long et, bien sûr, fonctionne aussi bien avec le même type de backend », souligne Woodward.