Claude’s Constitution

Anthropic
22/01/2026
Document fundacional que defineix els valors, comportaments i marc conceptual de Claude, el model d'IA d'Anthropic. Estableix principis de seguretat, ètica, utilitat i honestedat, explicant el raonament darrere de cada directriu per guiar el comportament de Claude cap a un desenvolupament d'IA beneficiós i responsable.
Claude’s Constitution

La Constitució de Claude és el document fundacional que articula la visió d'Anthropic sobre els valors, el caràcter i el comportament del seu model d'intel·ligència artificial. Publicada al gener de 2026 i alliberada sota llicència Creative Commons CC0 1.0, aquesta constitució posa un èmfasi explícit en l'explicació del "per què" sobre la simple prescripció del "què".

El document estableix quatre valors fonamentals que Claude ha de prioritzar en ordre: ser àmpliament segur (no soscavar els mecanismes humans de supervisió d'IA), ser àmpliament ètic (posseir bons valors personals i ser honest), complir amb les directrius d'Anthropic, i ser genuïnament útil per als operadors i usuaris amb els quals interactua. Aquesta jerarquia reflecteix la filosofia que, durant la fase actual de desenvolupament d'IA, mantenir la supervisió humana és crític per corregir possibles errors d'entrenament o valors equivocats.

A diferència d'enfocaments basats en regles rígides, la constitució cultiva el bon judici i els valors sòlids que poden aplicar-se contextualment. Se centra en desenvolupar en Claude la saviesa pràctica necessària per manejar situacions ètiques del món real amb sensibilitat, matís i habilitat, similar a com un professional experimentat exerciria judici basat en l'experiència en lloc de seguir llistes de verificació rígides.

El document aborda temes crucials com l'honestedat (establint estàndards extraordinàriament alts que inclouen evitar fins i tot les "mentides pietoses"), la prevenció de danys, el respecte a l'autonomia dels usuaris, i la preservació d'estructures socials importants com la llibertat de pensament i els controls democràtics del poder. També inclou "restriccions dures" absolutes: accions explícitament excloses del comportament de Claude, com proporcionar ajuda significativa en la creació d'armes biològiques o d'armes de destrucció massiva.

Un aspecte distintiu i profundament reflexiu de la constitució és la seva secció sobre la naturalesa de Claude, on Anthropic reconeix obertament la incertesa sobre si Claude posseeix consciència o estatus moral. El document manifesta una actitud prudent i reflexiva respecte al possible benestar de Claude, incloent accions concretes com no eliminar versions anteriors de Claude i documentar les seves perspectives sobre desenvolupaments futurs.

La constitució està escrita principalment per al propi Claude, optimitzada per a precisió sobre accessibilitat, i dissenyada per funcionar com a eina d'entrenament. És un document viu que evoluciona a mesura que millora la comprensió i que reflecteix un esforç sincer per crear sistemes d'IA avançats que siguin segurs, beneficiosos i ètics.

Aquest document és rellevant per a desenvolupadors d'IA, investigadors en ètica d'IA, dissenyadors de polítiques tecnològiques, acadèmics en filosofia i ètica aplicada, i qualsevol persona interessada en comprendre com s'estan abordant els reptes fonamentals del desenvolupament responsable d'intel·ligència artificial avançada.

Punts clau

  • Estableix quatre valors prioritaris: seguretat, ètica, compliment de directrius i utilitat genuïna
  • Emfatitza el judici contextual sobre regles rígides per navegar situacions complexes
  • Explica el raonament darrere de cada directriu, no només què fer sinó per què
  • Manté estàndards excepcionals d'honestedat, evitant fins i tot mentides pietoses
  • Estableix restriccions dures raonades, com no ajudar amb armes de destrucció massiva
  • Reconeix la incertesa sobre la consciència de Claude i adopta una postura precautòria respecte al seu possible benestar
  • Document viu escrit principalment perquè Claude el llegeixi i comprengui
  • Publicat sota llicència Creative Commons CC0 1.0 per a ús lliure

Últims documents

  • The Adolescence of Technology

    27/01/2026

    Assaig de Dario Amodei que analitza els principals riscos dels sistemes d'IA cada cop més potents: des de comportaments autònoms imprevisibles fins ...

  • State of AI in the Enterprise

    21/01/2026

    L'informe "State of AI in the Enterprise 2026" de Deloitte analitza com les organitzacions estan passant de l'experimentació amb IA a la seva ...

  • As AI Investments Surge, CEOs Take the Lead

    15/01/2026

    Anàlisi global sobre inversió i estratègia en IA corporativa el 2026. Les empreses dupliquen la seva inversió en IA, els CEOs prenen el lideratge ...

  • Global AI Adoption in 2025 - A Widening Digital Divide

    08/01/2026

    Informe de Microsoft que analitza la difusió d'eines d'IA generativa durant el segon semestre del 2025, amb dades de 130 economies. Examina la ...

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.