Mistral desarrolla OCR avanzado para documentos científicos y multilingües

06/03/2025

La empresa de inteligencia artificial ha desarrollado una herramienta de OCR que, según las pruebas comparativas publicadas, muestra mayor precisión en el procesamiento de documentos con elementos como ecuaciones matemáticas, tablas y contenido multilingüe.

Mistral desarrolla OCR avanzado para documentos científicos y multilingües

Mistral ha anunciado el lanzamiento de Mistral OCR, una API diseñada para el reconocimiento óptico de caracteres en documentos digitales. La herramienta está orientada a procesar documentos que contienen elementos diversos como texto, imágenes, tablas y ecuaciones matemáticas.

Según datos presentados por la compañía, aproximadamente el 90% de la información organizacional se encuentra almacenada en formato de documento. La nueva API procesa tanto imágenes como archivos PDF y extrae su contenido manteniendo la estructura original, lo que facilita su integración en sistemas de generación aumentada por recuperación (RAG) que trabajan con documentos multimodales.

El servicio ya ha sido implementado como modelo predeterminado para la comprensión de documentos en Le Chat, la plataforma conversacional de Mistral. La compañía ha publicado resultados de pruebas comparativas donde Mistral OCR alcanza un rendimiento general del 94,89% frente a soluciones como Google Document AI (83,42%), Azure OCR (89,52%) y GPT-4o (89,77%).

Las especificaciones técnicas indican que el sistema puede procesar hasta 2.000 páginas por minuto en un solo nodo. Otra característica destacada es la posibilidad de utilizar documentos completos como instrucciones y generar salidas en formatos estructurados como JSON.

Los desarrolladores mencionan diversos campos donde esta tecnología podría aplicarse, como la digitalización de investigaciones científicas, la preservación de documentos históricos, la optimización de servicios de atención al cliente y la conversión de literatura técnica y educativa en formatos procesables por sistemas de inteligencia artificial.

La API está disponible en la plataforma para desarrolladores de Mistral, denominada "la Plateforme". La empresa también ofrece pruebas gratuitas a través de Le Chat y contempla opciones de instalación local para organizaciones con requisitos especiales de privacidad de datos.

Vídeos

Enlaces

IA relacionada

Le Chat

Asistente de IA para vida y trabajo

Asistente de inteligencia artificial que combina capacidades conversacionales y herramientas especializadas. Ofrece funciones de chat, generación de código, análisis de datos y creación de flujos ...

Mistral AI

Modelos de IA eficientes y abiertos

Mistral AI desarrolla modelos de lenguaje portables con capacidades multilingües y alta eficiencia computacional. La plataforma permite implementaciones en la nube o locales, con opciones de ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.