La empresa de inteligencia artificial ha desarrollado una herramienta de OCR que, según las pruebas comparativas publicadas, muestra mayor precisión en el procesamiento de documentos con elementos como ecuaciones matemáticas, tablas y contenido multilingüe.
Mistral ha anunciado el lanzamiento de Mistral OCR, una API diseñada para el reconocimiento óptico de caracteres en documentos digitales. La herramienta está orientada a procesar documentos que contienen elementos diversos como texto, imágenes, tablas y ecuaciones matemáticas.
Según datos presentados por la compañía, aproximadamente el 90% de la información organizacional se encuentra almacenada en formato de documento. La nueva API procesa tanto imágenes como archivos PDF y extrae su contenido manteniendo la estructura original, lo que facilita su integración en sistemas de generación aumentada por recuperación (RAG) que trabajan con documentos multimodales.
El servicio ya ha sido implementado como modelo predeterminado para la comprensión de documentos en Le Chat, la plataforma conversacional de Mistral. La compañía ha publicado resultados de pruebas comparativas donde Mistral OCR alcanza un rendimiento general del 94,89% frente a soluciones como Google Document AI (83,42%), Azure OCR (89,52%) y GPT-4o (89,77%).
Las especificaciones técnicas indican que el sistema puede procesar hasta 2.000 páginas por minuto en un solo nodo. Otra característica destacada es la posibilidad de utilizar documentos completos como instrucciones y generar salidas en formatos estructurados como JSON.
Los desarrolladores mencionan diversos campos donde esta tecnología podría aplicarse, como la digitalización de investigaciones científicas, la preservación de documentos históricos, la optimización de servicios de atención al cliente y la conversión de literatura técnica y educativa en formatos procesables por sistemas de inteligencia artificial.
La API está disponible en la plataforma para desarrolladores de Mistral, denominada "la Plateforme". La empresa también ofrece pruebas gratuitas a través de Le Chat y contempla opciones de instalación local para organizaciones con requisitos especiales de privacidad de datos.
Asistente de inteligencia artificial que combina capacidades conversacionales y herramientas especializadas. Ofrece funciones de chat, generación de código, análisis de datos y creación de flujos ...
Mistral AI desarrolla modelos de lenguaje portables con capacidades multilingües y alta eficiencia computacional. La plataforma permite implementaciones en la nube o locales, con opciones de ...
09/06/2026
Anthropic presenta Claude Fable 5 y Claude Mythos 5, dos versiones de su modelo de mayor capacidad hasta la fecha. Comparten la misma base, pero uno ...
25/05/2026
El papa León XIV publica la primera encíclica dedicada a la inteligencia artificial, en la que fija la dignidad humana como criterio para todo ...
19/05/2026
Rime presenta Coda, un modelo de texto a voz para agentes conversacionales en tiempo real que reproduce el ritmo, las pausas y la entonación propios ...
11/05/2026
Thinking Machines Lab ha publicado una vista previa de investigación de TML-Interaction-Small, un modelo de interacción diseñado para colaborar ...