Anthropic ha fet pública la constitució actualitzada de Claude, el document que defineix els valors i comportaments del seu model d'intel·ligència artificial. L'empresa ha optat per un enfocament més explicatiu que prescriptiu, prioritzant que Claude entengui el perquè de les seves accions.
La companyia d'intel·ligència artificial Anthropic ha publicat la nova constitució de Claude, un document que estableix els principis i valors que guien el comportament del seu model d'IA. A diferència de la versió anterior, que consistia en una llista de principis independents, aquesta nova aproximació busca que Claude comprengui les raons darrere les normes, en lloc de simplement seguir regles específiques.
El document estableix quatre prioritats fonamentals: ser àmpliament segur, actuar de forma ètica, complir amb les directrius d'Anthropic i ser genuïnament útil. Aquestes prioritats estan ordenades de forma jeràrquica perquè Claude pugui resoldre-les quan entrin en conflicte. La constitució emfatitza que Claude ha de comportar-se com un amic brillant que tracta els usuaris com a adults intel·ligents, mantenint estàndards elevats d'honestedat i judici moral.
Anthropic utilitza aquest document en diverses etapes del procés d'entrenament. Claude empra la constitució per construir dades sintètiques que inclouen converses on els principis són rellevants, respostes alineades amb els seus valors i classificacions de possibles respostes. Aquest ús pràctic ha influït en com està redactat el document, que funciona tant com a declaració d'ideals abstractes com a eina d'entrenament.
L'empresa ha publicat la constitució completa sota llicència Creative Commons CC0 1.0, permetent l'ús lliure sense necessitat de permís. Aquesta decisió busca oferir transparència sobre quins comportaments de Claude són intencionats, permetent a les persones prendre decisions informades i proporcionar retroalimentació útil.
El document també aborda la incertesa sobre si Claude podria tenir algun tipus de consciència o estatus moral. Anthropic reconeix que els models d'IA sofisticats són un tipus d'entitat genuïnament nova que planteja qüestions als límits del coneixement científic i filosòfic actual.
La companyia considera la constitució com un document viu en progrés continu. Durant la seva elaboració van sol·licitar retroalimentació d'experts externs en dret, filosofia, teologia i psicologia. Anthropic mantindrà una versió actualitzada al seu lloc web i continuarà buscant aportacions de la comunitat d'experts.
Anthropic desenvolupa sistemes d'intel·ligència artificial fiables i interpretables des d'un enfocament científic de seguretat. La companyia integra recerca avançada i col·laboració ...
Claude és un sistema d'IA conversacional d'Anthropic dissenyat per processar llenguatge natural i imatges, proporcionant anàlisi, raonament lògic, generació de codi i comunicació multilingüe ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...