Mistral développe un OCR avancé pour documents scientifiques et multilingues

06/03/2025

L'entreprise d'intelligence artificielle a développé un outil d'OCR qui, selon les tests comparatifs publiés, montre une plus grande précision dans le traitement de documents contenant des éléments tels que des équations mathématiques, des tableaux et du contenu multilingue.

Mistral développe un OCR avancé pour documents scientifiques et multilingues

Mistral a annoncé le lancement de Mistral OCR, une API conçue pour la reconnaissance optique de caractères dans les documents numériques. L'outil est orienté vers le traitement de documents contenant divers éléments tels que du texte, des images, des tableaux et des équations mathématiques.

Selon les données présentées par l'entreprise, environ 90% des informations organisationnelles sont stockées au format document. La nouvelle API traite à la fois les images et les fichiers PDF et extrait leur contenu tout en maintenant la structure originale, ce qui facilite l'intégration dans les systèmes de génération augmentée par récupération (RAG) qui travaillent avec des documents multimodaux.

Le service a déjà été implémenté comme modèle par défaut pour la compréhension de documents dans Le Chat, la plateforme conversationnelle de Mistral. L'entreprise a publié des résultats de tests comparatifs où Mistral OCR atteint une performance globale de 94,89% par rapport à des solutions comme Google Document AI (83,42%), Azure OCR (89,52%) et GPT-4o (89,77%).

Les spécifications techniques indiquent que le système peut traiter jusqu'à 2 000 pages par minute sur un seul nœud. Une autre caractéristique notable est la possibilité d'utiliser des documents entiers comme instructions et de générer des sorties dans des formats structurés comme JSON.

Les développeurs mentionnent divers domaines où cette technologie pourrait être appliquée, comme la numérisation de la recherche scientifique, la préservation de documents historiques, l'optimisation du service client et la conversion de littérature technique et éducative en formats exploitables par les systèmes d'intelligence artificielle.

L'API est disponible sur la plateforme de développeurs de Mistral, appelée "la Plateforme". L'entreprise propose également des essais gratuits via Le Chat et envisage des options d'installation sur site pour les organisations ayant des exigences particulières en matière de confidentialité des données.

Vidéos

IA connexe

Le Chat

Assistant IA pour la vie et le travail

Assistant d'intelligence artificielle combinant capacités conversationnelles et outils spécialisés. Propose des fonctions de chat, génération de code, analyse de données et création de flux de ...

Mistral AI

Modèles d'IA efficaces et ouverts

Mistral AI développe des modèles de langage portables avec des capacités multilingues et une haute efficacité computationnelle. La plateforme permet des implémentations cloud ou sur site, avec ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.