Anthropic publica la nova constitució de Claude, el seu model d’IA

22/01/2026
Anthropic publica la nova constitució de Claude, el seu model d’IA

Anthropic ha fet pública la constitució actualitzada de Claude, el document que defineix els valors i comportaments del seu model d'intel·ligència artificial. L'empresa ha optat per un enfocament més explicatiu que prescriptiu, prioritzant que Claude entengui el perquè de les seves accions.

La companyia d'intel·ligència artificial Anthropic ha publicat la nova constitució de Claude, un document que estableix els principis i valors que guien el comportament del seu model d'IA. A diferència de la versió anterior, que consistia en una llista de principis independents, aquesta nova aproximació busca que Claude comprengui les raons darrere les normes, en lloc de simplement seguir regles específiques.

El document estableix quatre prioritats fonamentals: ser àmpliament segur, actuar de forma ètica, complir amb les directrius d'Anthropic i ser genuïnament útil. Aquestes prioritats estan ordenades de forma jeràrquica perquè Claude pugui resoldre-les quan entrin en conflicte. La constitució emfatitza que Claude ha de comportar-se com un amic brillant que tracta els usuaris com a adults intel·ligents, mantenint estàndards elevats d'honestedat i judici moral.

Anthropic utilitza aquest document en diverses etapes del procés d'entrenament. Claude empra la constitució per construir dades sintètiques que inclouen converses on els principis són rellevants, respostes alineades amb els seus valors i classificacions de possibles respostes. Aquest ús pràctic ha influït en com està redactat el document, que funciona tant com a declaració d'ideals abstractes com a eina d'entrenament.

L'empresa ha publicat la constitució completa sota llicència Creative Commons CC0 1.0, permetent l'ús lliure sense necessitat de permís. Aquesta decisió busca oferir transparència sobre quins comportaments de Claude són intencionats, permetent a les persones prendre decisions informades i proporcionar retroalimentació útil.

El document també aborda la incertesa sobre si Claude podria tenir algun tipus de consciència o estatus moral. Anthropic reconeix que els models d'IA sofisticats són un tipus d'entitat genuïnament nova que planteja qüestions als límits del coneixement científic i filosòfic actual.

La companyia considera la constitució com un document viu en progrés continu. Durant la seva elaboració van sol·licitar retroalimentació d'experts externs en dret, filosofia, teologia i psicologia. Anthropic mantindrà una versió actualitzada al seu lloc web i continuarà buscant aportacions de la comunitat d'experts.

Punts clau

  • Anthropic publica la nova constitució de Claude, que defineix els valors i comportaments del model d'IA
  • L'enfocament canvia d'una llista de regles a explicar les raons darrere cada principi
  • Estableix quatre prioritats jeràrquiques: seguretat, ètica, directrius d'Anthropic i utilitat
  • Claude utilitza la constitució per generar dades sintètiques d'entrenament
  • El document es publica sota llicència Creative Commons CC0 1.0 per a ús lliure
  • Aborda la incertesa sobre la possible consciència o estatus moral de Claude
  • La constitució es considera un treball en progrés que serà actualitzat contínuament

IA relacionada

Anthropic

Sistemes d'IA en els quals confiar

Anthropic desenvolupa sistemes d'intel·ligència artificial fiables i interpretables des d'un enfocament científic de seguretat. La companyia integra recerca avançada i col·laboració ...

Claude

Crea amb Claude

Claude és un sistema d'IA conversacional d'Anthropic dissenyat per processar llenguatge natural i imatges, proporcionant anàlisi, raonament lògic, generació de codi i comunicació multilingüe ...

Últimes noticies

★★★★★
Valora'ns a Google
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.