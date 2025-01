DeepSeek, une start-up chinoise spécialisée dans l’intelligence artificielle, a récemment bouleversé le secteur avec son modèle de langage, DeepSeek-R1. Ce modèle se distingue par des coûts de formation réduits, une efficacité énergétique accrue et des performances comparables à celles de ses concurrents occidentaux. Alors que des géants comme Meta, Google et OpenAI tentent de comprendre les raisons de cette avancée soudaine, Microsoft a choisi une approche différente en intégrant cette technologie prometteuse.

Mercredi, Microsoft a annoncé l’ajout de DeepSeek R1 à son vaste catalogue de modèles disponible sur Azure AI Foundry et sur GitHub. Cette collection compte désormais plus de 1 800 modèles, couvrant aussi bien des solutions de pointe et open source que des modèles spécialisés par secteur ou orientés tâches.

Ainsi, DeepSeek R1 est maintenant accessible via Azure AI Foundry, offrant une plateforme fiable, évolutive et adaptée aux entreprises. Cette intégration permet aux entreprises d’adopter facilement des solutions d’IA avancées, tout en respectant les accords de niveau de service (SLA), les normes de sécurité et les principes d’IA responsable — le tout soutenu par l’engagement de Microsoft en matière de fiabilité et d’innovation.

Asha Sharma, Corporate Vice President de la plateforme IA chez Microsoft, a souligné l’essor rapide de l’accessibilité au raisonnement par l’IA, qui transforme la manière dont les développeurs et les entreprises utilisent ces technologies avancées. Elle a insisté sur le fait que DeepSeek R1 constitue un modèle rentable pour les utilisateurs qui souhaitent exploiter des capacités d’IA de pointe en investissant le moins possible en infrastructure.

L’intégration de DeepSeek R1 dans Azure AI Foundry accélère les processus d’expérimentation, d’itération et d’intégration pour les développeurs. Grâce aux outils d’évaluation de modèles, ils peuvent comparer les résultats, mesurer les performances et passer rapidement à l’échelle pour leurs applications d’IA.

Engagement en faveur d’un développement IA fiable

Sharma a également souligné l’engagement de Microsoft pour la sûreté et la sécurité. DeepSeek R1 a fait l’objet de tests rigoureux et de contrôles de sécurité. Azure AI Content Safety propose par défaut un filtrage de contenu, avec possibilité de se désinscrire, tandis que le Safety Evaluation System aide à tester les applications avant leur mise en ligne pour garantir un déploiement en toute sécurité.

Pour utiliser DeepSeek R1 :

Créez un compte Azure si vous n’en possédez pas déjà un. Recherchez DeepSeek R1 dans le catalogue de modèles d’Azure AI Foundry. Ouvrez la fiche du modèle et cliquez sur « Deploy » pour obtenir l’API d’inférence et la clé, ainsi que l’accès au Playground. Utilisez l’API et la clé avec différents clients pour intégrer le modèle dans vos applications.

Déploiement local sur les PC Copilot+

Microsoft prévoit également d’apporter des versions de DeepSeek R1 optimisées pour les NPU (Neural Processing Unit) sur les Copilot+ PC, en commençant par la gamme Snapdragon X de Qualcomm, puis en poursuivant avec l’Intel Core Ultra 200V.

La première version, DeepSeek-R1-Distill-Qwen-1.5B, sera disponible dans l’AI Toolkit, suivie de variantes 7B et 14B. Grâce à ces modèles, les développeurs pourront créer et déployer des applications reposant sur l’IA de manière efficace et locale, en exploitant la puissance des NPUs.

Les NPU des Copilot+ PC prennent en charge l’inférence efficace de modèles, permettant une exécution semi-continue de l’IA générative. Les travaux de Microsoft autour de Phi Silica ont permis d’obtenir des résultats performants tant sur le temps de génération du premier jeton (time-to-first-token) que sur le débit, tout en réduisant l’impact sur l’autonomie de la batterie et les ressources du PC.

Les modèles DeepSeek optimisés pour NPU utilisent des techniques tels que la quantification basse résolution (low-bit) et le mappage des transformers sur le NPU, assurant une compatibilité dans l’écosystème Windows via le format ONNX QDQ.

Disponibilité

DeepSeek R1 est désormais disponible via un endpoint serverless dans le catalogue de modèles d’Azure AI Foundry. Vous trouverez davantage de ressources et des guides pas à pas sur GitHub. Les versions distillées de DeepSeek R1 pour un déploiement local sur les Copilot+ PC seront accessibles très prochainement.