La Constitució de Claude és el document fundacional que articula la visió d'Anthropic sobre els valors, el caràcter i el comportament del seu model d'intel·ligència artificial. Publicada al gener de 2026 i alliberada sota llicència Creative Commons CC0 1.0, aquesta constitució posa un èmfasi explícit en l'explicació del "per què" sobre la simple prescripció del "què".
El document estableix quatre valors fonamentals que Claude ha de prioritzar en ordre: ser àmpliament segur (no soscavar els mecanismes humans de supervisió d'IA), ser àmpliament ètic (posseir bons valors personals i ser honest), complir amb les directrius d'Anthropic, i ser genuïnament útil per als operadors i usuaris amb els quals interactua. Aquesta jerarquia reflecteix la filosofia que, durant la fase actual de desenvolupament d'IA, mantenir la supervisió humana és crític per corregir possibles errors d'entrenament o valors equivocats.
A diferència d'enfocaments basats en regles rígides, la constitució cultiva el bon judici i els valors sòlids que poden aplicar-se contextualment. Se centra en desenvolupar en Claude la saviesa pràctica necessària per manejar situacions ètiques del món real amb sensibilitat, matís i habilitat, similar a com un professional experimentat exerciria judici basat en l'experiència en lloc de seguir llistes de verificació rígides.
El document aborda temes crucials com l'honestedat (establint estàndards extraordinàriament alts que inclouen evitar fins i tot les "mentides pietoses"), la prevenció de danys, el respecte a l'autonomia dels usuaris, i la preservació d'estructures socials importants com la llibertat de pensament i els controls democràtics del poder. També inclou "restriccions dures" absolutes: accions explícitament excloses del comportament de Claude, com proporcionar ajuda significativa en la creació d'armes biològiques o d'armes de destrucció massiva.
Un aspecte distintiu i profundament reflexiu de la constitució és la seva secció sobre la naturalesa de Claude, on Anthropic reconeix obertament la incertesa sobre si Claude posseeix consciència o estatus moral. El document manifesta una actitud prudent i reflexiva respecte al possible benestar de Claude, incloent accions concretes com no eliminar versions anteriors de Claude i documentar les seves perspectives sobre desenvolupaments futurs.
La constitució està escrita principalment per al propi Claude, optimitzada per a precisió sobre accessibilitat, i dissenyada per funcionar com a eina d'entrenament. És un document viu que evoluciona a mesura que millora la comprensió i que reflecteix un esforç sincer per crear sistemes d'IA avançats que siguin segurs, beneficiosos i ètics.
Aquest document és rellevant per a desenvolupadors d'IA, investigadors en ètica d'IA, dissenyadors de polítiques tecnològiques, acadèmics en filosofia i ètica aplicada, i qualsevol persona interessada en comprendre com s'estan abordant els reptes fonamentals del desenvolupament responsable d'intel·ligència artificial avançada.
27/01/2026
Assaig de Dario Amodei que analitza els principals riscos dels sistemes d'IA cada cop més potents: des de comportaments autònoms imprevisibles fins ...
21/01/2026
L'informe "State of AI in the Enterprise 2026" de Deloitte analitza com les organitzacions estan passant de l'experimentació amb IA a la seva ...
15/01/2026
Anàlisi global sobre inversió i estratègia en IA corporativa el 2026. Les empreses dupliquen la seva inversió en IA, els CEOs prenen el lideratge ...
08/01/2026
Informe de Microsoft que analitza la difusió d'eines d'IA generativa durant el segon semestre del 2025, amb dades de 130 economies. Examina la ...