L'entreprise d'intelligence artificielle a développé un outil d'OCR qui, selon les tests comparatifs publiés, montre une plus grande précision dans le traitement de documents contenant des éléments tels que des équations mathématiques, des tableaux et du contenu multilingue.
Mistral a annoncé le lancement de Mistral OCR, une API conçue pour la reconnaissance optique de caractères dans les documents numériques. L'outil est orienté vers le traitement de documents contenant divers éléments tels que du texte, des images, des tableaux et des équations mathématiques.
Selon les données présentées par l'entreprise, environ 90% des informations organisationnelles sont stockées au format document. La nouvelle API traite à la fois les images et les fichiers PDF et extrait leur contenu tout en maintenant la structure originale, ce qui facilite l'intégration dans les systèmes de génération augmentée par récupération (RAG) qui travaillent avec des documents multimodaux.
Le service a déjà été implémenté comme modèle par défaut pour la compréhension de documents dans Le Chat, la plateforme conversationnelle de Mistral. L'entreprise a publié des résultats de tests comparatifs où Mistral OCR atteint une performance globale de 94,89% par rapport à des solutions comme Google Document AI (83,42%), Azure OCR (89,52%) et GPT-4o (89,77%).
Les spécifications techniques indiquent que le système peut traiter jusqu'à 2 000 pages par minute sur un seul nœud. Une autre caractéristique notable est la possibilité d'utiliser des documents entiers comme instructions et de générer des sorties dans des formats structurés comme JSON.
Les développeurs mentionnent divers domaines où cette technologie pourrait être appliquée, comme la numérisation de la recherche scientifique, la préservation de documents historiques, l'optimisation du service client et la conversion de littérature technique et éducative en formats exploitables par les systèmes d'intelligence artificielle.
L'API est disponible sur la plateforme de développeurs de Mistral, appelée "la Plateforme". L'entreprise propose également des essais gratuits via Le Chat et envisage des options d'installation sur site pour les organisations ayant des exigences particulières en matière de confidentialité des données.
Assistant d'intelligence artificielle combinant capacités conversationnelles et outils spécialisés. Propose des fonctions de chat, génération de code, analyse de données et création de flux de ...
Mistral AI développe des modèles de langage portables avec des capacités multilingues et une haute efficacité computationnelle. La plateforme permet des implémentations cloud ou sur site, avec ...
02/03/2026
Anthropic refuse de supprimer deux restrictions sur l'utilisation de son IA par l'armée, dans un conflit qui a conduit Trump à ordonner sa ...
25/02/2026
Perplexity présente Computer, un agent d'IA capable de créer et d'exécuter des flux de travail complets pendant des heures ou des mois, en ...
23/02/2026
Anthropic a identifié des campagnes à grande échelle de DeepSeek, Moonshot et MiniMax visant à extraire frauduleusement les capacités de son ...
21/02/2026
L'AI Impact Summit 2026 s'achève avec un accord volontaire signé par 88 pays qui pose les bases d'une coopération internationale autour du ...