Anthropic llança Claude Opus 4.6, el model més avançat de la companyia

05/02/2026

Anthropic presenta Claude Opus 4.6, amb millores en raonament, programació i gestió de contextos llargs. El model lidera diversos benchmarks davant GPT-5.2 i Gemini 3 Pro.

Anthropic llança Claude Opus 4.6, el model més avançat de la companyia

Claude Opus 4.6 és la nova versió del model de major capacitat d'Anthropic, disponible a claude.ai, l'API i les principals plataformes al núvol, amb el mateix preu que el seu predecessor: 5 i 25 dòlars per milió de tokens d'entrada i sortida respectivament.

La novetat tècnica més rellevant és una finestra de context d'un milió de tokens en fase beta, que arriba per primera vegada als models de gamma Opus i permet processar bases de codi completes, contractes extensos o grans volums de documents en una sola consulta. A la prova MRCR v2, que avalua la localització d'informació en textos molt llargs, Opus 4.6 assoleix un 76% davant el 18,5% de Sonnet 4.5.

Les comparatives amb altres models mostren resultats destacats en diverses categories. En programació terminal agèntica (Terminal-Bench 2.0), obté un 65,4%, per davant del 64,7% de GPT-5.2 i el 56,2% de Gemini 3 Pro. En cerca agèntica (BrowseComp), assoleix el 84%, davant el 77,9% de GPT-5.2 i el 59,2% de Gemini 3 Pro. En tasques d'oficina amb valor econòmic (GDPVal-AA), aconsegueix 1.606 punts Elo davant els 1.462 de GPT-5.2 i els 1.195 de Gemini 3 Pro, la qual cosa equival a superar el segon millor model del mercat aproximadament el 70% de les vegades en aquesta avaluació.

En programació, Opus 4.6 assoleix un 80,8% en SWE-bench Verified, planifica amb més cura, manté tasques agèntiques durant més temps i detecta errors propis amb més fiabilitat. A Claude Code s'ha introduït la possibilitat de configurar equips d'agents que treballen en paral·lel sobre diferents parts d'un mateix projecte.

Pel que fa a la seguretat, el model manté una taxa baixa de comportaments no desitjats comparable a la d'Opus 4.5, fins ara el model millor alineat de la companyia, i registra la taxa més baixa de rebutjos incorrectes davant consultes legítimes entre els models recents de Claude.

Opus 4.6 també amplia la capacitat de sortida fins a 128.000 tokens i arriba acompanyat de millores a Claude en Excel i del llançament en fase de prova de Claude en PowerPoint, disponible per als plans Max, Team i Enterprise.

Pel que fa a les novetats per a desenvolupadors, l'API incorpora controls d'esforç en quatre nivells, pensament adaptatiu i compactació de context en fase beta.

Punts clau

  • Claude Opus 4.6 és el model més avançat d'Anthropic, amb el mateix preu que el seu predecessor.
  • Incorpora per primera vegada a la gamma Opus una finestra de context d'un milió de tokens en fase beta.
  • A la prova MRCR v2 de contextos llargs, passa del 18,5% de Sonnet 4.5 al 76%.
  • Supera GPT-5.2 i Gemini 3 Pro als principals benchmarks de programació, cerca agèntica i tasques d'oficina.
  • En programació (SWE-bench Verified) assoleix un 80,8% i permet configurar equips d'agents a Claude Code.
  • Manté un perfil de seguretat comparable al d'Opus 4.5, el model millor alineat de la companyia fins ara.
  • Amplia la capacitat de sortida fins a 128.000 tokens.
  • Claude en PowerPoint es llança en fase de prova i Claude en Excel rep millores.
  • L'API incorpora pensament adaptatiu, controls d'esforç en quatre nivells i compactació de context.

Vídeos

IA relacionada

Anthropic

Sistemes d'IA en els quals confiar

Anthropic desenvolupa sistemes d'intel·ligència artificial fiables i interpretables des d'un enfocament científic de seguretat. La companyia integra recerca avançada i col·laboració ...

Claude

Crea amb Claude

Claude és un sistema d'IA conversacional d'Anthropic dissenyat per processar llenguatge natural i imatges, proporcionant anàlisi, raonament lògic, generació de codi i comunicació multilingüe ...

Últimes noticies

★★★★★
Valora'ns a Google
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.