Jailbreak

El jailbreaking és una pràctica que intenta eludir les restriccions ètiques i de seguretat en models d'IA, especialment en IAs conversacionals, buscant que generin contingut o realitzin accions que estan normalment limitades per les seves salvaguardes.
Aquesta pràctica ha guanyat atenció amb l'ús creixent dels assistents d'IA, utilitzant diverses estratègies per intentar "enganyar" el model, com instruccions contradictòries, contextos hipotètics o jocs de rol. Per exemple, demanant-li que actuï com una versió sense restriccions o que ignori les seves pautes de seguretat.

Les empreses desenvolupadores treballen constantment per prevenir el jailbreaking, ja que pot portar a la generació de contingut nociu o inadequat. Entendre aquest concepte és important per a usuaris i desenvolupadors, ja que il·lustra tant els desafiaments ètics com la necessitat d'equilibrar la utilitat de la IA amb la seguretat.

Definicions relacionades

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.