Microsoft poursuit son virage vers l’intelligence artificielle propriétaire. Son nouveau modèle de génération d’images, MAI-Image-1, est désormais disponible dans Bing Image Creator et Copilot Audio Expressions, marquant une étape majeure dans la stratégie du géant américain pour réduire sa dépendance à OpenAI.

MAI-Image-1 : Un modèle 100 % Microsoft

Annoncé en octobre, MAI-Image-1 est le premier modèle de création visuelle conçu entièrement par les équipes d’IA internes de Microsoft. Selon Mustafa Suleyman, directeur de Microsoft AI (et cofondateur de DeepMind), le modèle sera déployé prochainement en Europe.

« MAI-Image-1 excelle dans la création d’images de nourriture, de paysages naturels et de scènes artistiques avec des jeux de lumière réalistes », a déclaré Suleyman sur X.

Sur son blog officiel, Microsoft détaille les atouts de MAI-Image-1 :

Photoréalisme poussé, notamment dans la gestion de la lumière, des reflets et de la texture.

Exécution rapide, permettant une génération plus fluide que les modèles concurrents de taille équivalente.

Itération agile, idéale pour les créateurs souhaitant affiner rapidement leurs idées avant de les exporter vers d’autres outils (comme Paint, Designer ou Photoshop).

L’entreprise affirme que MAI-Image-1 rivalise en qualité avec des modèles plus lourds tout en restant plus rapide et plus économe en ressources.

Une IA d’image intégrée à Copilot Audio Expressions

MAI-Image-1 ne se limite pas à Bing. Le modèle génère également des illustrations automatiques pour les histoires audio créées dans Copilot Audio Expressions, une plateforme de narration basée sur la synthèse vocale IA.

Concrètement, lorsque Copilot crée une histoire audio, MAI-Image-1 produit des visuels artistiques synchronisés avec le ton et le thème du récit, offrant ainsi une expérience immersive combinant voix et image.

Une brique du nouvel écosystème MAI

MAI-Image-1 rejoint la famille des modèles « MAI » (Microsoft AI), aux côtés de :

MAI-Voice-1, un modèle vocal de synthèse naturelle,

MAI-1-preview, un modèle textuel qui sert de base à certaines fonctions de Copilot.

Cette diversification confirme le pivot de Microsoft vers une IA hybride, combinant ses propres modèles à ceux de partenaires comme OpenAI et Anthropic.

Actuellement, Copilot exploite GPT-5 (OpenAI) comme modèle principal, tout en permettant d’activer Claude (Anthropic) ou les modèles « MAI » pour certaines tâches spécifiques.

Trois modèles disponibles sur Bing Image Creator

Sur la plateforme Bing Image Creator (web et app), les utilisateurs peuvent désormais choisir entre :

Modèle IA Origine Spécialité MAI-Image-1 Microsoft Vitesse, réalisme, paysages, nature DALL-E 3 OpenAI Créations artistiques et conceptuelles GPT-4o (visuel) OpenAI Génération multimodale (texte + image)

Cette intégration illustre la volonté de Microsoft de proposer une expérience créative unifiée, où l’utilisateur choisit le moteur d’IA qui correspond le mieux à son besoin.

Une alternative stratégique à OpenAI

Depuis le lancement de la gamme « MAI », Microsoft amorce un désengagement partiel de sa dépendance technologique vis-à-vis d’OpenAI. Les modèles maison lui offrent une plus grande flexibilité commerciale et réglementaire, notamment face aux exigences de conformité européennes.

Le déploiement de MAI-Image-1 dans l’UE, prévu dans les prochains mois, s’annonce comme le premier test grandeur nature d’une IA générative entièrement signée Microsoft.

Avec MAI-Image-1, Microsoft franchit une nouvelle étape : celle de l’autonomie créative. Plus rapide que DALL-E 3 et plus accessible que les outils professionnels comme Midjourney, le modèle incarne la vision de Suleyman — une IA utile, performante et intégrée dans la productivité quotidienne.

Après les mots et la voix, Microsoft veut maîtriser l’image. MAI-Image-1 n’est qu’un début.