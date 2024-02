Google DeepMind a récemment annoncé le lancement de Gemma, ses nouveaux modèles open source 2B et 7B, construits à partir des mêmes recherches et technologies que les modèles Gemini précédemment présentés par l’entreprise. Il s’agit d’une étape significative dans l’évolution de l’accès aux technologies d’IA avancées pour les développeurs. En effet, cette initiative marque une étape importante dans le domaine de l’intelligence artificielle, car elle reflète l’engagement de Google dans le partage de technologies avancées avec la communauté des développeurs et chercheurs.

Gemma se positionne comme une alternative plus légère et ouverte, idéalement adaptée à des tâches plus simples telles que la création de chatbots ou la réalisation de résumés. Malgré leur taille réduite, les modèles Gemma se distinguent par leur capacité à surpasser des modèles bien plus importants sur des benchmarks clés, selon Google.

Les modèles Gemma seront disponibles en versions pré-entraînées et ajustées par instruction, accompagnés d’une licence commerciale permissive. Cette démarche est complétée par la mise à disposition d’un nouvel ensemble d’outils pour une IA générative responsable. Google propose également des chaînes d’outils pour l’inférence et le fine-tuning supervisé (SFT) compatibles avec les principaux frameworks tels que JAX, PyTorch, et TensorFlow via Keras 3.0. Des notebooks prêts à l’emploi sur Colab et Kaggle sont fournis, et Gemma est intégré avec des plateformes telles que Hugging Face, MaxText, et NVIDIA NeMo, permettant une exécution sur des ordinateurs portables, des stations de travail, ou sur le cloud de Google.

En parallèle, Nvidia a annoncé avoir collaboré avec Google pour lancer des optimisations sur toutes les plateformes AI de NVIDIA, afin d’accélérer les performances de Gemma. Cette collaboration souligne l’importance de l’interopérabilité et de l’optimisation dans l’écosystème de l’IA.

Jeanine Banks, vice-présidente et directrice générale de Developer X chez Google, a souligné que les modèles Gemma s’inscrivent dans la continuité des efforts de Google pour rendre accessible la technologie d’IA, en offrant à la fois des API et des modèles ouverts. Cette approche vise à fournir un large éventail de capacités à la communauté, facilitant ainsi le prototypage précoce et la personnalisation ultérieure des modèles.

Réduire les risques associés aux modèles d’IA

Google DeepMind s’engage également à publier un ensemble complet de benchmarks pour évaluer Gemma par rapport à d’autres modèles, dans un effort de transparence et de contribution à l’amélioration continue de la sécurité et de la fiabilité des modèles d’IA. Ces évaluations comprennent des tests adversaires automatiques, des red teaming manuels, et des évaluations des capacités des modèles pour des activités potentiellement dangereuses.

L’accent mis sur la sécurité et la conception responsable de Gemma témoigne de l’importance accordée par Google DeepMind aux principes d’IA responsables. L’entreprise cherche à réduire les risques associés aux modèles d’IA en utilisant des techniques automatisées pour filtrer les informations personnelles sensibles et en appliquant un apprentissage par renforcement à partir de retours humains pour aligner les modèles sur des comportements responsables.

Ce développement illustre l’engagement croissant envers une IA ouverte et responsable, en mettant l’accent sur la nécessité d’intégrer diverses perspectives pour améliorer les systèmes de sécurité et encourager une innovation éthique dans le domaine de l’IA.

En nommant ce modèle « Gemma », qui signifie pierre précieuse, Google souligne la valeur et l’importance de ces nouvelles ressources d’IA dans le paysage technologique actuel, offrant aux développeurs des outils puissants et accessibles pour innover et créer de manière responsable.