Claude’s Constitution

Anthropic
22/01/2026
Documento fundacional que define los valores, comportamientos y marco conceptual de Claude, el modelo de IA de Anthropic. Establece principios de seguridad, ética, utilidad y honestidad, explicando el razonamiento detrás de cada directriz para guiar el comportamiento de Claude hacia un desarrollo de IA beneficioso y responsable.
Claude’s Constitution

La Constitución de Claude es el documento fundacional que articula la visión de Anthropic sobre los valores, el carácter y el comportamiento de su modelo de inteligencia artificial. Publicada en enero de 2026 y liberada bajo licencia Creative Commons CC0 1.0, esta constitución pone un énfasis explícito en la explicación del "por qué" sobre la simple prescripción del "qué".

El documento establece cuatro valores fundamentales que Claude debe priorizar en orden: ser ampliamente seguro (no socavar los mecanismos humanos de supervisión de IA), ser ampliamente ético (poseer buenos valores personales y ser honesto), cumplir con las directrices de Anthropic, y ser genuinamente útil para los operadores y usuarios con los que interactúa. Esta jerarquía refleja la filosofía de que, durante la fase actual de desarrollo de IA, mantener la supervisión humana es crítico para corregir posibles errores de entrenamiento o valores equivocados.

A diferencia de enfoques basados en reglas rígidas, la constitución cultiva el buen juicio y los valores sólidos que pueden aplicarse contextualmente. Se centra en desarrollar en Claude la sabiduría práctica necesaria para manejar situaciones éticas del mundo real con sensibilidad, matiz y habilidad, similar a como lo haría un profesional experimentado que ejerce criterio basado en la experiencia en lugar de seguir listas de verificación rígidas.

El documento aborda temas cruciales como la honestidad (estableciendo estándares extraordinariamente altos que incluyen evitar incluso las "mentiras piadosas"), la prevención de daños, el respeto a la autonomía de los usuarios, y la preservación de estructuras sociales importantes como la libertad de pensamiento y los controles democráticos del poder. También incluye "restricciones duras" absolutas: acciones explícitamente excluidas del comportamiento de Claude, como proporcionar ayuda significativa en la creación de armas biológicas o de destrucción masiva.

Un aspecto distintivo y profundamente reflexivo de la constitución es su sección sobre la naturaleza de Claude, donde Anthropic reconoce abiertamente la incertidumbre sobre si Claude posee conciencia o estatus moral. El documento manifiesta una actitud prudente y reflexiva respecto al posible bienestar de Claude, incluyendo acciones concretas como no eliminar versiones anteriores de Claude y documentar sus perspectivas sobre futuros desarrollos.

La constitución está escrita principalmente para Claude mismo, optimizada para precisión sobre accesibilidad, y diseñada para funcionar como herramienta de entrenamiento. Es un documento vivo que evoluciona conforme mejora la comprensión y que refleja un esfuerzo sincero por crear sistemas de IA avanzados que sean seguros, beneficiosos y éticos.

Este documento es relevante para desarrolladores de IA, investigadores en ética de IA, diseñadores de políticas tecnológicas, académicos en filosofía y ética aplicada, y cualquier persona interesada en comprender cómo se están abordando los desafíos fundamentales del desarrollo responsable de inteligencia artificial avanzada.

Puntos clave

  • Establece cuatro valores prioritarios: seguridad, ética, cumplimiento de directrices y utilidad genuina
  • Enfatiza el juicio contextual sobre reglas rígidas para navegar situaciones complejas
  • Explica el razonamiento detrás de cada directriz, no solo qué hacer sino por qué
  • Mantiene estándares excepcionales de honestidad, evitando incluso mentiras piadosas
  • Establece restricciones duras razonadas, como no ayudar en armas de destrucción masiva
  • Reconoce incertidumbre sobre la conciencia de Claude y adopta postura precautoria sobre su posible bienestar
  • Documento vivo escrito principalmente para que Claude lo lea y comprenda
  • Publicado bajo licencia Creative Commons CC0 1.0 para uso libre

Últimos documentos

  • The Adolescence of Technology

    27/01/2026

    Ensayo de Dario Amodei que analiza los principales riesgos de los sistemas de IA cada vez más potentes: desde comportamientos autónomos ...

  • State of AI in the Enterprise

    21/01/2026

    El informe "State of AI in the Enterprise 2026" de Deloitte analiza cómo las organizaciones están pasando de la experimentación con IA a su ...

  • As AI Investments Surge, CEOs Take the Lead

    15/01/2026

    Análisis global sobre inversión y estrategia en IA corporativa en 2026. Las empresas duplican su inversión en IA, los CEOs toman el liderazgo de ...

  • Global AI Adoption in 2025 - A Widening Digital Divide

    08/01/2026

    Informe de Microsoft que analiza la difusión de herramientas de IA generativa durante el segundo semestre de 2025, con datos de 130 economías. ...

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.