L’extraction de texte à partir de documents n’est plus suffisante. À mesure que les entreprises déploient des systèmes d’IA générative, des moteurs de recherche internes et des architectures RAG (Retrieval-Augmented Generation), la compréhension de la structure d’un document devient presque aussi importante que son contenu.
C’est dans ce contexte que Mistral AI dévoile Mistral OCR 4, une nouvelle génération de technologie OCR conçue pour transformer les documents d’entreprise en données exploitables par les modèles d’intelligence artificielle.
Plus qu’un simple outil de reconnaissance de texte, OCR 4 ambitionne de devenir une véritable couche d’ingestion documentaire pour les workflows IA modernes.
Un OCR qui comprend la structure des documents
Traditionnellement, les systèmes OCR convertissent des images ou des PDF en texte brut. Mistral OCR 4 va plus loin. Le modèle génère simultanément le texte reconnu, les coordonnées précises (bounding boxes) de chaque élément, une classification des blocs de contenu, des scores de confiance au niveau des pages et des mots et une sortie structurée au format Markdown.
Cette approche permet non seulement de récupérer l’information, mais également de préserver l’organisation logique du document. Pour les entreprises qui alimentent des bases de connaissances, des moteurs de recherche internes ou des agents IA, cette granularité représente un avantage considérable.
Une architecture conçue pour le RAG et les agents IA
L’un des objectifs affichés de Mistral est de faire d’OCR 4 une brique fondamentale des systèmes de Retrieval-Augmented Generation. Grâce à sa compréhension structurelle des documents, le modèle facilite le découpage sémantique des contenus, l’indexation documentaire avancée, les moteurs de recherche d’entreprise, les agents IA chargés du traitement administratif ou encore les systèmes de conformité et d’audit.
Dans un environnement où les entreprises accumulent des millions de PDF, rapports, contrats et factures, la capacité à transformer rapidement ces archives en données exploitables devient un enjeu stratégique.
170 langues prises en charge
L’une des forces majeures d’OCR 4 réside dans sa couverture linguistique. Le modèle prend en charge 170 langues, 10 grandes familles linguistiques et des langues spécialisées ou peu représentées dans les jeux de données traditionnels.
Selon Mistral, c’est précisément sur ces langues à faibles ressources que son nouveau moteur affiche ses gains de performance les plus importants. Une caractéristique particulièrement intéressante pour les multinationales opérant sur plusieurs continents.
Un déploiement pensé pour les environnements sensibles
Contrairement à de nombreuses solutions cloud-first, OCR 4 peut être déployé entièrement sur l’infrastructure du client. Le modèle fonctionne dans un conteneur unique et peut être installé en environnement privé.
Cette approche répond directement aux besoins des administrations publiques, des institutions financières, des secteurs réglementés et des entreprises soumises à des contraintes de souveraineté numérique. Autrement dit, les documents n’ont jamais besoin de quitter les infrastructures de l’organisation.
Pour évaluer son nouveau modèle, Mistral l’a comparé à plusieurs catégories de concurrents :
- Les solutions OCR classiques
- Les modèles OCR natifs IA
- Les grands modèles généralistes
- Sa propre génération OCR 3
Les résultats revendiqués sont particulièrement élevés :
|
Benchmark |
Score OCR 4 |
|---|---|
|
OlmOCRBench |
85,20 |
|
OmniDocBench |
93,07 |
|
Crawl Multilingual |
0,98 |
Selon l’entreprise, OCR 4 a également été préféré dans la majorité des cas lors d’une évaluation humaine portant sur plus de 600 documents réels rédigés dans plus d’une douzaine de langues. Mistral rappelle néanmoins que les benchmarks doivent être interprétés avec prudence, certains systèmes de notation pénalisant parfois des réponses pourtant correctes sur le plan sémantique.

OCR 4 ou Document AI : quelle différence ?
Mistral distingue désormais deux approches complémentaires :
- OCR 4 API : Destiné aux développeurs, OCR 4 fournit du texte brut, du markdown structuré, des coordonnées spatiales, une classification des blocs et des scores de confiance. Cette version cible les intégrations techniques et les pipelines documentaires à grande échelle.
- Document AI : Accessible via Mistral Studio, Document AI ajoute des sorties JSON personnalisées, des schémas métier, des résumés pilotés par prompts, et l’interprétation documentaire avancée.
L’objectif est de permettre aux équipes métier d’exploiter les documents sans développer leur propre couche de traitement.
Les cas d’usage visés
Mistral met particulièrement en avant plusieurs scénarios :
- Gestion documentaire : Numérisation d’archives, indexation de rapports techniques et traitement de documents historiques.
- Facturation et conformité : Extraction automatique des données de factures, vérification documentaire et automatisation des contrôles réglementaires.
- Recherche d’entreprise : Création de moteurs de recherche internes capables de retrouver précisément des informations dans d’immenses volumes documentaires.
- Agents IA : Automatisation du remplissage de formulaires, traitement administratif et workflows métier assistés par l’IA.
Une stratégie qui dépasse le simple OCR
Avec OCR 4, Mistral ne cherche pas uniquement à concurrencer les acteurs historiques de la reconnaissance documentaire. La société française s’inscrit dans une tendance plus large : faire de l’IA une couche native de compréhension de l’information d’entreprise.
Dans cette vision, le document n’est plus un fichier statique. Il devient une source de données structurées directement exploitable par les modèles de langage, les moteurs de recherche et les agents autonomes.
À mesure que les entreprises accélèrent leurs projets d’IA générative, ce type de technologie pourrait devenir aussi stratégique que les modèles eux-mêmes.
Prix et disponibilité
Mistral OCR 4 est disponible dès aujourd’hui via l’API de Mistral ainsi que dans Document AI au sein de Mistral Studio.
Voici les tarifs annoncés :
- OCR 4 API : 4 dollars pour 1 000 pages
- Batch API : 2 dollars pour 1 000 pages
- Document AI : 5 dollars pour 1 000 pages
Le service est également accessible via Amazon SageMaker et Microsoft Foundry, tandis qu’une intégration avec Snowflake Parse Document est déjà en préparation.
Avec OCR 4, Mistral AI poursuit une stratégie cohérente : construire un écosystème complet autour de l’intelligence artificielle d’entreprise. Après les modèles de langage, les agents et les outils de recherche, la société française s’attaque désormais à l’une des ressources les plus sous-exploitées des organisations : leurs documents.
Et dans un monde où la donnée non structurée représente encore l’immense majorité du patrimoine informationnel des entreprises, cette bataille pourrait s’avérer bien plus importante qu’elle n’y paraît.



