Curso introdutório de agente de IA da Microsoft: Agentic RAG

Informações sobre o cursoPublicado há 7 meses Círculo de compartilhamento de IA

16.5K 00

Este curso oferece uma visão geral abrangente do Agentic Retrieval-Augmented Generation (Agentic RAG), um paradigma emergente de IA no qual os modelos de linguagem grande (LLMs) planejam autonomamente suas próximas ações enquanto adquirem informações de fontes externas. Diferentemente do modelo estático "pesquisar e ler", o Agentic RAG envolve chamadas iterativas para LLMs, intercaladas com chamadas de ferramentas ou funções e saída estruturada. O sistema avalia os resultados, otimiza a consulta, chama outras ferramentas quando necessário e continua esse ciclo até chegar a uma solução satisfatória.

breve

Este curso abordará os seguintes tópicos:

Entendendo o RAG autêntico. Saiba mais sobre o paradigma emergente em IA, em que os LLMs (Large Language Models) planejam de forma autônoma seus próximos movimentos enquanto extraem informações de fontes de dados externas.
Dominar o modelo iterativo de "criador e verificador". A compreensão do loop de chamadas iterativas ao LLM, intercaladas com chamadas de ferramentas ou funções e saída estruturada, tem o objetivo de melhorar a correção e lidar com consultas mal formatadas.
Explore os aplicativos práticos. Identificar cenários em que o Agentic RAG se destaca, como ambientes que priorizam a correção, interações complexas com bancos de dados e fluxos de trabalho ampliados.

meta de aprendizado

Após concluir este curso, você saberá como entender:

Entendendo o RAG autêntico. Saiba mais sobre o paradigma emergente em IA, em que os LLMs (Large Language Models) planejam de forma autônoma seus próximos movimentos enquanto extraem informações de fontes de dados externas.
O modelo iterativo "maker-checker". Compreender o conceito de chamadas iterativas aos loops do LLM, intercaladas com chamadas de ferramentas ou funções e saídas estruturadas, projetadas para melhorar a correção e lidar com consultas mal formatadas.
Possui o processo de raciocínio de. Entender que o sistema possui a capacidade de seu processo de raciocínio para decidir como abordar um problema sem depender de caminhos predefinidos.
Fluxo de trabalho. Saiba como os modelos Agentic podem tomar decisões independentes para recuperar relatórios de tendências de mercado, identificar dados da concorrência, correlacionar métricas de vendas internas, sintetizar resultados e avaliar estratégias.
Loops iterativos, integração de ferramentas e memória. Entenda como os sistemas se baseiam em padrões de interação cíclica para manter o estado e a memória entre as etapas, a fim de evitar ciclos repetitivos e tomar decisões informadas.
Lidar com modos de falha e autocorreção. Explore os mecanismos robustos de autocorreção do sistema, incluindo iteração e nova consulta, uso de ferramentas de diagnóstico e dependência de supervisão humana.
Limites do Agente. Entenda as limitações do Agentic RAG, concentrando-se na autonomia específica do domínio, na dependência da infraestrutura e no respeito às proteções.
Casos práticos de uso e valor. Identificar cenários em que o Agentic RAG se destaca, como ambientes que priorizam a correção, interações complexas com bancos de dados e fluxos de trabalho ampliados.
Governança, transparência e confiança. Compreender a importância da governança e da transparência, incluindo o raciocínio explicável, o controle de vieses e a supervisão humana.

O que é o Agentic RAG?

O Agentic Retrieval-Augmented Generation (Agentic RAG) é um paradigma emergente de IA no qual os modelos de linguagem grande (LLMs) planejam de forma autônoma suas próximas ações enquanto extraem informações de fontes externas. Diferentemente do modelo estático "recuperar e ler", o Agentic RAG envolve chamadas iterativas para LLMs, intercaladas com chamadas de ferramentas ou funções e saída estruturada. O sistema avalia os resultados, otimiza a consulta, chama outras ferramentas quando necessário e continua esse ciclo até chegar a uma solução satisfatória. Esse modelo iterativo de "maker-checker" melhora a correção, lida com consultas mal formatadas e garante resultados de alta qualidade.

O sistema possui ativamente seu processo de raciocínio, reescrevendo consultas com falha, selecionando diferentes métodos de recuperação e integrando várias ferramentas (por exemplo, pesquisas vetoriais no Azure AI Search, bancos de dados SQL ou APIs personalizadas) antes de determinar sua resposta. As implementações tradicionais de RAG dependem de caminhos predefinidos, mas os sistemas Agentic determinam de forma autônoma a ordem das etapas com base na qualidade das informações que encontram.

Definição Agentic Retrieval-Augmented Generation (Agentic RAG)

O Agentic Retrieval-Augmented Generation (Agentic RAG) é um paradigma emergente no desenvolvimento de IA, em que os LLMs não apenas extraem informações de fontes de dados externas, mas também planejam de forma autônoma suas próximas ações. Diferentemente do modelo estático "recuperar-então-ler" ou de sequências elaboradas de dicas, o Agentic RAG envolve loops de chamada iterativos para LLMs, intercalados com chamadas de ferramentas ou funções e saídas estruturadas. Em cada etapa, o sistema avalia os resultados obtidos, decide se deve ou não otimizar a consulta, chama outras ferramentas, se necessário, e continua esse ciclo até obter uma solução satisfatória.

Essa abordagem iterativa de "maker-checker" foi projetada para melhorar a correção, lidar com consultas mal formatadas em bancos de dados estruturados (por exemplo, NL2SQL) e garantir resultados equilibrados e de alta qualidade. Em vez de depender exclusivamente de cadeias de dicas elaboradas, o sistema possui ativamente seu processo de raciocínio. Ele pode reescrever consultas com falha, selecionar diferentes métodos de recuperação e integrar várias ferramentas (por exemplo, pesquisas vetoriais no Azure AI Search, bancos de dados SQL ou APIs personalizadas) antes de finalizar sua resposta. Isso elimina a necessidade de estruturas de orquestração excessivamente complexas. Em vez disso, um loop relativamente simples de "chamada LLM → uso de ferramenta → chamada LLM → ..." pode produzir resultados complexos e bem fundamentados.

Dominar o processo de raciocínio

A característica distintiva que torna um sistema "Agêntico" é sua capacidade de ter seu próprio processo de raciocínio. As implementações tradicionais de RAG geralmente dependem de seres humanos para predefinir o caminho do modelo: uma cadeia de pensamento que delineia o que recuperar e quando. Mas quando um sistema é realmente Agentic, ele decide internamente como abordar um problema. Ele não executa apenas scripts; ele determina de forma autônoma a ordem das etapas com base na qualidade das informações que encontra. Por exemplo, se for solicitado que ele crie uma estratégia de lançamento de produto, ele não confiará apenas em um prompt que detalha todo o fluxo de trabalho de pesquisa e tomada de decisões. Em vez disso, o modelo Agentic decide de forma independente:

Use o Bing Web Grounding para obter relatórios atuais de tendências de mercado.
Use o Azure AI Search para identificar dados relevantes da concorrência.
Use o Banco de Dados SQL do Azure para associar métricas históricas de vendas internas.
Sintetize a análise em estratégias coesas com o Azure OpenAI Service.
As estratégias são avaliadas quanto a lacunas ou inconsistências e, se necessário, é solicitada outra rodada de pesquisa. Todas essas etapas (otimização da consulta, seleção de fontes, iteração até ficar "satisfeito" com a resposta) são determinadas pelo modelo, e não pré-escritas por humanos.

Loops iterativos, integração de ferramentas e memória

O sistema Agentic se baseia em um modelo de interação cíclica:

Chamada inicial. Os objetivos do usuário (ou seja, as solicitações do usuário) são apresentados ao LLM.
Chamada de ferramenta. Se o modelo identificar informações ausentes ou instruções ambíguas, ele seleciona uma ferramenta ou método de recuperação (por exemplo, uma consulta de banco de dados vetorial (por exemplo, a pesquisa híbrida de dados privados do Azure AI Search) ou uma chamada SQL estruturada) para reunir mais contexto.
Avaliação e otimização. Após analisar os dados retornados, o modelo decide se há informações suficientes. Se não forem suficientes, ele otimizará a consulta, tentará ferramentas diferentes ou ajustará sua abordagem.
Repita até ficar satisfeito. Esse ciclo continua até que o modelo determine que tem clareza e evidências suficientes para fornecer uma resposta final bem fundamentada.
Memória e status. Como o sistema mantém o estado e a memória ao longo das etapas, ele pode se lembrar de tentativas anteriores e de seus resultados, evitando ciclos repetitivos e tomando decisões mais informadas à medida que avança.

Com o tempo, isso cria um senso de compreensão em evolução que permite que o modelo lide com tarefas complexas de várias etapas sem a necessidade de intervenção humana contínua ou de redesenho das dicas.

Lidar com modos de falha e autocorreção

A autonomia do Agentic RAG também inclui um poderoso mecanismo de autocorreção. Quando o sistema chega a um beco sem saída (por exemplo, recupera um documento irrelevante ou encontra uma consulta formatada incorretamente), ele pode:

Iteração e novas consultas. Em vez de retornar respostas de baixo valor, o modelo tenta novas estratégias de pesquisa, reescreve as consultas ao banco de dados ou examina conjuntos de dados alternativos.
Uso de ferramentas de diagnóstico. O sistema pode chamar funções adicionais projetadas para ajudá-lo a depurar suas etapas de inferência ou confirmar a exatidão dos dados recuperados. Ferramentas como o Azure AI Tracing ajudarão a permitir observabilidade e monitoramento robustos.
Dependência de supervisão manual. Em caso de alto risco ou falhas repetidas, o modelo pode sinalizar a incerteza e solicitar orientação humana. Quando o ser humano fornece feedback corretivo, o modelo pode adotar a experiência no futuro.

Essa abordagem iterativa e dinâmica permite o aprimoramento contínuo do modelo, garantindo que ele não seja apenas um sistema único, mas que possa aprender com os erros em uma determinada sessão.

Limites do agente

Embora o Agentic RAG seja autônomo em suas tarefas, ele não é equivalente à IA de uso geral. Seus recursos "Agentic" são limitados às ferramentas, fontes de dados e políticas fornecidas por desenvolvedores humanos. Ele não pode inventar suas próprias ferramentas ou ir além dos limites de um domínio definido. Em vez disso, ela se destaca por orquestrar dinamicamente os recursos disponíveis. As principais diferenças em relação às formas mais avançadas de IA incluem:

Autonomia em áreas específicas. Os sistemas Agentic RAG concentram-se em atingir metas definidas pelo usuário em domínios conhecidos, usando estratégias como reescrita de consultas ou seleção de ferramentas para melhorar os resultados.
Dependências de infraestrutura. A capacidade do sistema depende das ferramentas e dos dados que os desenvolvedores integram. Ele não pode transcender esses limites sem intervenção humana.
Respeito ao guard-rail. O código de ética, as regras de conformidade e as estratégias comerciais continuam sendo importantes. A liberdade do agente está sempre sujeita a medidas de segurança e mecanismos de supervisão (espera-se?).

Casos práticos de uso e valor

O Agentic RAG se destaca em cenários que exigem otimização iterativa e precisão:

Ambiente de "correção em primeiro lugar". Em verificações de conformidade, análises normativas ou pesquisas jurídicas, os modelos Agentic podem verificar os fatos de forma iterativa, consultar várias fontes e reescrever as consultas até que seja gerada uma resposta totalmente examinada.
Interações complexas de bancos de dados. Ao trabalhar com dados estruturados, em que as consultas podem falhar com frequência ou precisam ser ajustadas, os sistemas podem usar o Azure SQL ou o Microsoft Fabric OneLake para otimizar autonomamente suas consultas e garantir que a recuperação final corresponda à intenção do usuário.
Fluxo de trabalho estendido. Sessões mais longas podem mudar à medida que novas informações são disponibilizadas, e o Agentic RAG pode integrar continuamente novos dados, mudando as estratégias à medida que se aprende mais sobre o espaço do problema.

Governança, transparência e confiança

À medida que esses sistemas se tornam mais autônomos em seu raciocínio, a governança e a transparência são fundamentais:

Raciocínio interpretável. Os modelos podem fornecer uma trilha de auditoria das consultas que fazem, das fontes que consultam e das etapas de raciocínio que tomam para chegar às suas conclusões. Ferramentas como o Azure AI Content Safety e o Azure AI Tracing / GenAIOps podem ajudar a manter a transparência e mitigar os riscos.
Controle de desvios e recuperação de equilíbrio. Os desenvolvedores podem ajustar as estratégias de recuperação para garantir que fontes de dados equilibradas e representativas sejam consideradas, e usar o Azure Machine Learning para personalizar modelos para organizações avançadas de ciência de dados, auditando regularmente a saída para detectar tendências ou padrões distorcidos.
Supervisão e conformidade manual. O RAG autêntico não substitui o julgamento manual na tomada de decisões de alto risco, mas o aumenta ao oferecer a opção de uma revisão mais completa.

É fundamental ter ferramentas que forneçam um registro claro das operações. Sem elas, a depuração de um processo de várias etapas pode ser muito difícil. Consulte a Literal AI (a empresa por trás da Chainlit) para obter um exemplo de execução de agente:

chegar a um veredicto

O Agentic RAG representa uma evolução natural na forma como os sistemas de IA abordam tarefas complexas e com uso intensivo de dados. Ao adotar um modelo de interação cíclica, selecionando ferramentas de forma autônoma e otimizando as consultas até obter resultados de alta qualidade, os sistemas estão se transformando de seguidores estáticos de comandos em tomadores de decisão mais adaptáveis e conscientes do contexto. Embora ainda estejam vinculados a infraestruturas e éticas definidas por humanos, esses recursos Agentic proporcionam interações de IA mais ricas, mais dinâmicas e, em última análise, mais úteis para empresas e usuários finais.