L'empresa d'intel·ligència artificial ha desenvolupat una eina d'OCR que, segons les proves comparatives publicades, mostra més precisió en el processament de documents amb elements com equacions matemàtiques, taules i contingut multilingüe.
Mistral ha anunciat el llançament de Mistral OCR, una API dissenyada per al reconeixement òptic de caràcters en documents digitals. L'eina està orientada a processar documents que contenen elements diversos com text, imatges, taules i equacions matemàtiques.
Segons dades presentades per la companyia, aproximadament el 90% de la informació organitzacional es troba emmagatzemada en format de document. La nova API processa tant imatges com arxius PDF i n'extreu el contingut mantenint l'estructura original, cosa que facilita la seva integració en sistemes de generació augmentada per recuperació (RAG) que treballen amb documents multimodals.
El servei ja ha estat implementat com a model predeterminat per a la comprensió de documents a Le Chat, la plataforma conversacional de Mistral. La companyia ha publicat resultats de proves comparatives on Mistral OCR aconsegueix un rendiment general del 94,89% davant de solucions com Google Document AI (83,42%), Azure OCR (89,52%) i GPT-4o (89,77%).
Les especificacions tècniques indiquen que el sistema pot processar fins a 2.000 pàgines per minut en un sol node. Una altra característica destacada és la possibilitat d'utilitzar documents complets com a instruccions i generar sortides en formats estructurats com JSON.
Els desenvolupadors esmenten diversos camps on aquesta tecnologia podria aplicar-se, com la digitalització d'investigacions científiques, la preservació de documents històrics, l'optimització de serveis d'atenció al client i la conversió de literatura tècnica i educativa en formats processables per sistemes d'intel·ligència artificial.
L'API està disponible a la plataforma per a desenvolupadors de Mistral, anomenada "la Plateforme". L'empresa també ofereix proves gratuïtes a través de Le Chat i contempla opcions d'instal·lació local per a organitzacions amb requisits especials de privacitat de dades.
Assistent d'intel·ligència artificial que combina capacitats conversacionals i eines especialitzades. Ofereix funcions de xat, generació de codi, anàlisi de dades i creació de fluxos de treball ...
Mistral AI desenvolupa models de llenguatge portables amb capacitats multilingües i alta eficiència computacional. La plataforma permet implementacions al núvol o locals, amb opcions de ...
15/01/2026
Replit ha llançat Mobile Apps on Replit, una funcionalitat que permet descriure una idea, crear l'aplicació i publicar-la completament a l'App ...
14/01/2026
Google ha presentat Personal Intelligence, una funció que permet a Gemini accedir a informació d'aplicacions com Gmail, Google Photos i YouTube per ...
07/01/2026
OpenAI ha presentat ChatGPT Health, una experiència dedicada que permet als usuaris connectar els seus historials mèdics i aplicacions de benestar ...
05/01/2026
Amazon presenta Alexa.com, una nova plataforma que porta el seu assistent d'intel·ligència artificial Alexa+ al navegador web i completa la seva ...