L'empresa d'intel·ligència artificial ha desenvolupat una eina d'OCR que, segons les proves comparatives publicades, mostra més precisió en el processament de documents amb elements com equacions matemàtiques, taules i contingut multilingüe.
Mistral ha anunciat el llançament de Mistral OCR, una API dissenyada per al reconeixement òptic de caràcters en documents digitals. L'eina està orientada a processar documents que contenen elements diversos com text, imatges, taules i equacions matemàtiques.
Segons dades presentades per la companyia, aproximadament el 90% de la informació organitzacional es troba emmagatzemada en format de document. La nova API processa tant imatges com arxius PDF i n'extreu el contingut mantenint l'estructura original, cosa que facilita la seva integració en sistemes de generació augmentada per recuperació (RAG) que treballen amb documents multimodals.
El servei ja ha estat implementat com a model predeterminat per a la comprensió de documents a Le Chat, la plataforma conversacional de Mistral. La companyia ha publicat resultats de proves comparatives on Mistral OCR aconsegueix un rendiment general del 94,89% davant de solucions com Google Document AI (83,42%), Azure OCR (89,52%) i GPT-4o (89,77%).
Les especificacions tècniques indiquen que el sistema pot processar fins a 2.000 pàgines per minut en un sol node. Una altra característica destacada és la possibilitat d'utilitzar documents complets com a instruccions i generar sortides en formats estructurats com JSON.
Els desenvolupadors esmenten diversos camps on aquesta tecnologia podria aplicar-se, com la digitalització d'investigacions científiques, la preservació de documents històrics, l'optimització de serveis d'atenció al client i la conversió de literatura tècnica i educativa en formats processables per sistemes d'intel·ligència artificial.
L'API està disponible a la plataforma per a desenvolupadors de Mistral, anomenada "la Plateforme". L'empresa també ofereix proves gratuïtes a través de Le Chat i contempla opcions d'instal·lació local per a organitzacions amb requisits especials de privacitat de dades.
Assistent d'intel·ligència artificial que combina capacitats conversacionals i eines especialitzades. Ofereix funcions de xat, generació de codi, anàlisi de dades i creació de fluxos de treball ...
Mistral AI desenvolupa models de llenguatge portables amb capacitats multilingües i alta eficiència computacional. La plataforma permet implementacions al núvol o locals, amb opcions de ...
03/06/2025
ElevenLabs ha llançat Eleven v3 (alpha), un model de conversió de text a veu que incorpora eines de control emocional i capacitats de diàleg ...
29/05/2025
Black Forest Labs presenta FLUX.1 Kontext, una nova família de models d'intel·ligència artificial que permet generar i editar imatges utilitzant ...
22/05/2025
Anthropic presenta Claude Opus 4 i Sonnet 4, models d'intel·ligència artificial que assoleixen nous registres en avaluacions de codi i incorporen ...
16/05/2025
Codex és un agent basat en intel·ligència artificial que optimitza el desenvolupament de programari automatitzant múltiples tasques ...