RAG é uma técnica que combina recuperação de informação com geração de texto. Em vez de usar apenas o conhecimento interno do modelo, o sistema primeiro busca documentos relevantes em uma base de conhecimento pré-definida e depois usa esses documentos como contexto para gerar a resposta. Isso reduz alucinações, mantém o assistente dentro do escopo desejado, e funciona como um guardrail natural: se a informação não está na base, o modelo não tem como inventar.