Anthropic ha presentat Claude Opus 4.5, un model d'IA que estableix nous màxims en proves de desenvolupament de programari real. El sistema incorpora millores en programació, ús d'agents i control d'ordinadors, amb actualitzacions en productes com Claude Code i Excel.
Anthropic ha anunciat Claude Opus 4.5, disponible des d'avui a la seva API, aplicacions i les tres principals plataformes de núvol. El sistema obté un 80,9% de precisió a SWE-bench Verified, l'avaluació de referència per a enginyeria de programari en condicions reals, superant models com Sonnet 4.5 (77,2%) i altres competidors del sector. En programació multilingüe lidera en 7 dels 8 llenguatges avaluats.
A més de liderar en programació amb agents, el model mostra capacitats superiors en múltiples àrees tècniques. En ús d'eines obté un 98,2% en escenaris de telecomunicacions i un 88,9% en entorns de comerç minorista. En tasques d'ús d'ordinadors registra un 66,3%, i en raonament visual un 80,7%. El sistema també aconsegueix un 90,8% en respostes multilingües i un 87% en raonament de nivell universitari.
Una característica diferencial és el nou paràmetre d'esforç a l'API, que permet als desenvolupadors ajustar l'equilibri entre capacitat i consum de tokens. Amb nivell mitjà d'esforç, Opus 4.5 iguala el rendiment de Sonnet 4.5 utilitzant un 76% menys de tokens de sortida. Al seu nivell màxim, supera Sonnet 4.5 en 4,3 punts percentuals mentre consumeix un 48% menys de tokens.
Anthropic va realitzar proves internes on Claude Opus 4.5 va completar un examen tècnic de dues hores per a candidats a enginyeria de rendiment, obtenint la puntuació més alta registrada entre tots els candidats humans avaluats. La companyia indica que aquest resultat planteja qüestions sobre com la intel·ligència artificial modificarà el desenvolupament de programari com a professió.
Quant a seguretat, Claude Opus 4.5 presenta major resistència a atacs d'injecció de prompts que qualsevol altre model del mercat. En proves amb mil consultes, el model registra una taxa d'èxit d'atac del 4,7%, enfront del 7,3% de Sonnet 4.5, el 12,5% de Gemini 3 Pro i el 12,6% de GPT-5.1.
Anthropic ha actualitzat diversos productes aprofitant les capacitats del model. Claude Code incorpora un mode Plan que genera arxius editables abans d'executar tasques. Les converses a les aplicacions ja no tenen límit de longitud, ja que el sistema resumeix automàticament el context anterior. Claude for Excel ha ampliat l'accés beta a tots els usuaris Max, Team i Enterprise.
Claude Opus 4.5 està disponible a l'API amb identificador claude-opus-4-5-20251101. El preu s'estableix en 5 dòlars per milió de tokens d'entrada i 25 dòlars per milió de tokens de sortida.
Anthropic desenvolupa sistemes d'intel·ligència artificial fiables i interpretables des d'un enfocament científic de seguretat. La companyia integra recerca avançada i col·laboració ...
Claude és un sistema d'IA conversacional d'Anthropic dissenyat per processar llenguatge natural i imatges, proporcionant anàlisi, raonament lògic, generació de codi i comunicació multilingüe ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...