Claude Opus 4.5, el nou model d’Anthropic que domina en enginyeria de programari

24/11/2025

Anthropic ha presentat Claude Opus 4.5, un model d'IA que estableix nous màxims en proves de desenvolupament de programari real. El sistema incorpora millores en programació, ús d'agents i control d'ordinadors, amb actualitzacions en productes com Claude Code i Excel.

Claude Opus 4.5, el nou model d’Anthropic que domina en enginyeria de programari

Anthropic ha anunciat Claude Opus 4.5, disponible des d'avui a la seva API, aplicacions i les tres principals plataformes de núvol. El sistema obté un 80,9% de precisió a SWE-bench Verified, l'avaluació de referència per a enginyeria de programari en condicions reals, superant models com Sonnet 4.5 (77,2%) i altres competidors del sector. En programació multilingüe lidera en 7 dels 8 llenguatges avaluats.

A més de liderar en programació amb agents, el model mostra capacitats superiors en múltiples àrees tècniques. En ús d'eines obté un 98,2% en escenaris de telecomunicacions i un 88,9% en entorns de comerç minorista. En tasques d'ús d'ordinadors registra un 66,3%, i en raonament visual un 80,7%. El sistema també aconsegueix un 90,8% en respostes multilingües i un 87% en raonament de nivell universitari.

Una característica diferencial és el nou paràmetre d'esforç a l'API, que permet als desenvolupadors ajustar l'equilibri entre capacitat i consum de tokens. Amb nivell mitjà d'esforç, Opus 4.5 iguala el rendiment de Sonnet 4.5 utilitzant un 76% menys de tokens de sortida. Al seu nivell màxim, supera Sonnet 4.5 en 4,3 punts percentuals mentre consumeix un 48% menys de tokens.

Anthropic va realitzar proves internes on Claude Opus 4.5 va completar un examen tècnic de dues hores per a candidats a enginyeria de rendiment, obtenint la puntuació més alta registrada entre tots els candidats humans avaluats. La companyia indica que aquest resultat planteja qüestions sobre com la intel·ligència artificial modificarà el desenvolupament de programari com a professió.

Quant a seguretat, Claude Opus 4.5 presenta major resistència a atacs d'injecció de prompts que qualsevol altre model del mercat. En proves amb mil consultes, el model registra una taxa d'èxit d'atac del 4,7%, enfront del 7,3% de Sonnet 4.5, el 12,5% de Gemini 3 Pro i el 12,6% de GPT-5.1.

Anthropic ha actualitzat diversos productes aprofitant les capacitats del model. Claude Code incorpora un mode Plan que genera arxius editables abans d'executar tasques. Les converses a les aplicacions ja no tenen límit de longitud, ja que el sistema resumeix automàticament el context anterior. Claude for Excel ha ampliat l'accés beta a tots els usuaris Max, Team i Enterprise.

Claude Opus 4.5 està disponible a l'API amb identificador claude-opus-4-5-20251101. El preu s'estableix en 5 dòlars per milió de tokens d'entrada i 25 dòlars per milió de tokens de sortida.

Punts clau

  • Claude Opus 4.5 obté un 80,9% a SWE-bench Verified, superant Sonnet 4.5 i altres competidors
  • Lidera en 7 dels 8 llenguatges de programació en avaluacions multilingües
  • Incorpora paràmetre d'esforç que permet ajustar el consum de tokens mantenint o superant el rendiment
  • Amb nivell mitjà d'esforç iguala Sonnet 4.5 usant un 76% menys de tokens de sortida
  • Va superar tots els candidats humans en examen tècnic d'enginyeria de rendiment de dues hores
  • Registra 4,7% de vulnerabilitat a atacs d'injecció de prompts, la taxa més baixa del mercat
  • Claude Code incorpora mode Plan amb arxius editables abans d'executar tasques
  • Les converses a les aplicacions ja no tenen límit de longitud

Vídeos

IA relacionada

Anthropic

Sistemes d'IA en els quals confiar

Anthropic desenvolupa sistemes d'intel·ligència artificial fiables i interpretables des d'un enfocament científic de seguretat. La companyia integra recerca avançada i col·laboració ...

Claude

Crea amb Claude

Claude és un sistema d'IA conversacional d'Anthropic dissenyat per processar llenguatge natural i imatges, proporcionant anàlisi, raonament lògic, generació de codi i comunicació multilingüe ...

Últimes noticies

★★★★★
Valora'ns a Google
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.