Mistral desenvolupa OCR avançat per a documents científics i multilingües

06/03/2025

L'empresa d'intel·ligència artificial ha desenvolupat una eina d'OCR que, segons les proves comparatives publicades, mostra més precisió en el processament de documents amb elements com equacions matemàtiques, taules i contingut multilingüe.

Mistral desenvolupa OCR avançat per a documents científics i multilingües

Mistral ha anunciat el llançament de Mistral OCR, una API dissenyada per al reconeixement òptic de caràcters en documents digitals. L'eina està orientada a processar documents que contenen elements diversos com text, imatges, taules i equacions matemàtiques.

Segons dades presentades per la companyia, aproximadament el 90% de la informació organitzacional es troba emmagatzemada en format de document. La nova API processa tant imatges com arxius PDF i n'extreu el contingut mantenint l'estructura original, cosa que facilita la seva integració en sistemes de generació augmentada per recuperació (RAG) que treballen amb documents multimodals.

El servei ja ha estat implementat com a model predeterminat per a la comprensió de documents a Le Chat, la plataforma conversacional de Mistral. La companyia ha publicat resultats de proves comparatives on Mistral OCR aconsegueix un rendiment general del 94,89% davant de solucions com Google Document AI (83,42%), Azure OCR (89,52%) i GPT-4o (89,77%).

Les especificacions tècniques indiquen que el sistema pot processar fins a 2.000 pàgines per minut en un sol node. Una altra característica destacada és la possibilitat d'utilitzar documents complets com a instruccions i generar sortides en formats estructurats com JSON.

Els desenvolupadors esmenten diversos camps on aquesta tecnologia podria aplicar-se, com la digitalització d'investigacions científiques, la preservació de documents històrics, l'optimització de serveis d'atenció al client i la conversió de literatura tècnica i educativa en formats processables per sistemes d'intel·ligència artificial.

L'API està disponible a la plataforma per a desenvolupadors de Mistral, anomenada "la Plateforme". L'empresa també ofereix proves gratuïtes a través de Le Chat i contempla opcions d'instal·lació local per a organitzacions amb requisits especials de privacitat de dades.

Vídeos

Enllaços

IA relacionada

Le Chat

Assistent d'IA per a la vida i el treball

Assistent d'intel·ligència artificial que combina capacitats conversacionals i eines especialitzades. Ofereix funcions de xat, generació de codi, anàlisi de dades i creació de fluxos de treball ...

Mistral AI

Models d'IA eficients i oberts

Mistral AI desenvolupa models de llenguatge portables amb capacitats multilingües i alta eficiència computacional. La plataforma permet implementacions al núvol o locals, amb opcions de ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.