Anthropic presenta Claude Opus 4.6, amb millores en raonament, programació i gestió de contextos llargs. El model lidera diversos benchmarks davant GPT-5.2 i Gemini 3 Pro.
Claude Opus 4.6 és la nova versió del model de major capacitat d'Anthropic, disponible a claude.ai, l'API i les principals plataformes al núvol, amb el mateix preu que el seu predecessor: 5 i 25 dòlars per milió de tokens d'entrada i sortida respectivament.
La novetat tècnica més rellevant és una finestra de context d'un milió de tokens en fase beta, que arriba per primera vegada als models de gamma Opus i permet processar bases de codi completes, contractes extensos o grans volums de documents en una sola consulta. A la prova MRCR v2, que avalua la localització d'informació en textos molt llargs, Opus 4.6 assoleix un 76% davant el 18,5% de Sonnet 4.5.
Les comparatives amb altres models mostren resultats destacats en diverses categories. En programació terminal agèntica (Terminal-Bench 2.0), obté un 65,4%, per davant del 64,7% de GPT-5.2 i el 56,2% de Gemini 3 Pro. En cerca agèntica (BrowseComp), assoleix el 84%, davant el 77,9% de GPT-5.2 i el 59,2% de Gemini 3 Pro. En tasques d'oficina amb valor econòmic (GDPVal-AA), aconsegueix 1.606 punts Elo davant els 1.462 de GPT-5.2 i els 1.195 de Gemini 3 Pro, la qual cosa equival a superar el segon millor model del mercat aproximadament el 70% de les vegades en aquesta avaluació.
En programació, Opus 4.6 assoleix un 80,8% en SWE-bench Verified, planifica amb més cura, manté tasques agèntiques durant més temps i detecta errors propis amb més fiabilitat. A Claude Code s'ha introduït la possibilitat de configurar equips d'agents que treballen en paral·lel sobre diferents parts d'un mateix projecte.
Pel que fa a la seguretat, el model manté una taxa baixa de comportaments no desitjats comparable a la d'Opus 4.5, fins ara el model millor alineat de la companyia, i registra la taxa més baixa de rebutjos incorrectes davant consultes legítimes entre els models recents de Claude.
Opus 4.6 també amplia la capacitat de sortida fins a 128.000 tokens i arriba acompanyat de millores a Claude en Excel i del llançament en fase de prova de Claude en PowerPoint, disponible per als plans Max, Team i Enterprise.
Pel que fa a les novetats per a desenvolupadors, l'API incorpora controls d'esforç en quatre nivells, pensament adaptatiu i compactació de context en fase beta.
Anthropic desenvolupa sistemes d'intel·ligència artificial fiables i interpretables des d'un enfocament científic de seguretat. La companyia integra recerca avançada i col·laboració ...
Claude és un sistema d'IA conversacional d'Anthropic dissenyat per processar llenguatge natural i imatges, proporcionant anàlisi, raonament lògic, generació de codi i comunicació multilingüe ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...