RAG (Generació Augmentada per Recuperació) és una tècnica que combina la cerca d'informació en una base de coneixements amb la generació de text mitjançant
intel·ligència artificial. És com donar a un
model d'IA accés a una biblioteca personalitzada abans de demanar-li que respongui preguntes.
Imagina un assistent virtual amb accés a tots els documents de la teva empresa. Quan li fas una pregunta, primer cerca en aquests documents la informació rellevant i després utilitza aquesta informació per generar una resposta precisa i contextualitzada.
Aquesta tècnica resol un dels principals problemes dels models de llenguatge: les "
al·lucinacions" o la generació d'informació incorrecta. En ancorar les respostes en documents reals, el RAG garanteix que la informació sigui precisa i verificable. També permet que el sistema es mantingui actualitzat sense necessitat de reentrenar tot el model.
El RAG s'implementa en diversos camps: xatbots empresarials, sistemes d'atenció al client, documentació tècnica i fins i tot en l'àmbit mèdic, on ajuda a consultar ràpidament historials clínics i literatura mèdica actualitzada.