Curso de introducción al agente de Microsoft AI: Agentic RAG

Información sobre el cursoPublicado hace 1 año Círculo de intercambio de inteligencia artificial

53.1K 00

Este curso proporciona una visión global de la Generación Agentic Retrieval-Augmented (Agentic RAG), un paradigma de IA emergente en el que los grandes modelos lingüísticos (LLM) planifican de forma autónoma sus próximas acciones mientras adquieren información de fuentes externas. A diferencia del modelo estático de "búsqueda-lectura", el Agentic RAG implica llamadas iterativas a los LLM, intercaladas con llamadas a herramientas o funciones y resultados estructurados. El sistema evalúa los resultados, optimiza la consulta, llama a otras herramientas cuando es necesario y continúa este ciclo hasta alcanzar una solución satisfactoria.

breve

En este curso se tratarán los siguientes temas:

Comprender el GAR agenético. Conozca el nuevo paradigma de la inteligencia artificial en el que los modelos lingüísticos de gran tamaño (LLM) planifican de forma autónoma sus próximos movimientos mientras extraen información de fuentes de datos externas.
Dominar el modelo iterativo "maker-checker". La comprensión del bucle de llamadas iterativas al LLM, intercaladas con llamadas a herramientas o funciones y salida estructurada, pretende mejorar la corrección y hacer frente a las consultas mal formateadas.
Explorar aplicaciones prácticas. Identificar los escenarios en los que Agentic RAG brilla, como los entornos en los que "lo primero es la corrección", las interacciones complejas con bases de datos y los flujos de trabajo ampliados.

objetivo de aprendizaje

Tras completar este curso, sabrá cómo/comprender:

Comprender el GAR agenético. Conozca el nuevo paradigma de la inteligencia artificial en el que los modelos lingüísticos de gran tamaño (LLM) planifican de forma autónoma sus próximos movimientos mientras extraen información de fuentes de datos externas.
El modelo iterativo "maker-checker". Comprender el concepto de llamadas iterativas a los bucles de LLM, intercaladas con llamadas a herramientas o funciones y salidas estructuradas, diseñadas para mejorar la corrección y hacer frente a consultas mal formateadas.
Posee el proceso de razonamiento de. Entender que el sistema posee la capacidad de su proceso de razonamiento para decidir cómo abordar un problema sin depender de caminos predefinidos.
Flujo de trabajo. Descubra cómo los modelos Agentic pueden tomar decisiones independientes para recuperar informes de tendencias de mercado, identificar datos de la competencia, correlacionar métricas de ventas internas, sintetizar resultados y evaluar estrategias.
Bucles iterativos, integración de herramientas y memoria. Comprender cómo los sistemas se basan en patrones de interacción cíclica para mantener el estado y la memoria a través de los pasos para evitar ciclos repetitivos y tomar decisiones informadas.
Tratamiento de los modos de fallo y autocorrección. Explorar los sólidos mecanismos de autocorrección del sistema, incluida la iteración y la nueva consulta, el uso de herramientas de diagnóstico y la dependencia de la supervisión humana.
Límites del Agente. Comprender las limitaciones del GAR Agentic, centrándose en la autonomía específica del dominio, la dependencia de la infraestructura y el respeto de los guardarraíles.
Casos prácticos y valor. Identificar los escenarios en los que Agentic RAG brilla, como los entornos en los que "lo primero es la corrección", las interacciones complejas con bases de datos y los flujos de trabajo ampliados.
Gobernanza, transparencia y confianza. Comprender la importancia de la gobernanza y la transparencia, incluidos el razonamiento explicable, el control de sesgos y la supervisión humana.

¿Qué es el GAR agéntico?

La Generación Agenética de Recuperación-Aumentada (Agentic RAG) es un paradigma emergente de IA en el que los Modelos de Lenguaje de Gran Tamaño (LLM) planifican de forma autónoma sus próximas acciones mientras extraen información de fuentes externas. A diferencia del modelo estático "recuperar-luego-leer", la RAG Agentic implica llamadas iterativas a los LLM, intercaladas con llamadas a herramientas o funciones y resultados estructurados. El sistema evalúa los resultados, optimiza la consulta, llama a otras herramientas cuando es necesario y continúa este ciclo hasta alcanzar una solución satisfactoria. Este modelo iterativo de "maker-checker" mejora la corrección, gestiona las consultas mal formateadas y garantiza resultados de alta calidad.

El sistema es dueño activo de su proceso de razonamiento, reescribiendo consultas fallidas, seleccionando diferentes métodos de recuperación e integrando múltiples herramientas (por ejemplo, búsquedas vectoriales en Azure AI Search, bases de datos SQL o API personalizadas) antes de determinar finalmente su respuesta.La característica distintiva de un sistema Agentic es su capacidad de ser dueño de su proceso de razonamiento. Las implementaciones RAG tradicionales se basan en rutas predefinidas, pero los sistemas Agentic determinan de forma autónoma el orden de los pasos en función de la calidad de la información que encuentran.

Definición Generación Agentic Retrieval-Augmented (RAG Agentic)

La Generación Agentic Retrieval-Augmented (RAG Agentic) es un paradigma emergente en el desarrollo de la IA, en el que los LLM no sólo extraen información de fuentes de datos externas, sino que también planifican de forma autónoma sus próximas acciones. A diferencia del modelo estático "recuperar-luego-leer" o de las elaboradas secuencias de señalización, la RAG Agentic implica bucles de llamada iterativos a los LLM, intercalados con llamadas a herramientas o funciones y salidas estructuradas. En cada paso, el sistema evalúa los resultados que obtiene, decide si optimiza o no su consulta, llama a otras herramientas si es necesario, y continúa este ciclo hasta obtener una solución satisfactoria.

Este enfoque iterativo de "comprobador de creadores" está diseñado para mejorar la corrección, gestionar consultas mal formateadas a bases de datos estructuradas (por ejemplo, NL2SQL) y garantizar resultados equilibrados y de alta calidad. En lugar de basarse únicamente en elaboradas cadenas de sugerencias, el sistema controla activamente su proceso de razonamiento. Puede reescribir consultas fallidas, seleccionar diferentes métodos de recuperación e integrar múltiples herramientas (por ejemplo, búsquedas vectoriales en Azure AI Search, bases de datos SQL o API personalizadas) antes de finalizar su respuesta. Esto elimina la necesidad de marcos de orquestación excesivamente complejos. En su lugar, un bucle relativamente sencillo de "llamada LLM → uso de herramienta → llamada LLM → ..." puede producir resultados complejos y bien razonados.

Apropiarse del proceso de razonamiento

El rasgo distintivo que hace que un sistema sea "Agentic" es su capacidad para tener su propio proceso de razonamiento. Las aplicaciones tradicionales de la GAR suelen depender de los humanos para predefinir el camino del modelo: una cadena de pensamiento que esboza qué recuperar y cuándo. Pero cuando un sistema es verdaderamente agenético, decide internamente cómo abordar un problema. No se limita a ejecutar guiones, sino que determina de forma autónoma el orden de los pasos en función de la calidad de la información que encuentra. Por ejemplo, si se le pide que cree una estrategia de lanzamiento de un producto, no se limitará a confiar en una indicación que detalla todo el flujo de trabajo de investigación y toma de decisiones. En su lugar, el modelo Agentic decide de forma independiente:

Utilice Bing Web Grounding para obtener informes sobre las tendencias actuales del mercado.
Utilice Azure AI Search para identificar datos relevantes de la competencia.
Utilice Azure SQL Database para asociar métricas históricas de ventas internas.
Sintetice los análisis en estrategias coherentes con Azure OpenAI Service.
Las estrategias se evalúan en busca de lagunas o incoherencias y, si es necesario, se solicita otra ronda de búsqueda. Todas estas etapas (optimización de la consulta, selección de las fuentes, iteración hasta obtener una respuesta "satisfactoria") vienen determinadas por el modelo, no por una escritura humana previa.

Bucles iterativos, integración de herramientas y memoria

El sistema Agentic se basa en un modelo de interacción cíclica:

Llamada inicial. Los objetivos del usuario (es decir, las indicaciones del usuario) se presentan al LLM.
Llamada a la herramienta. Si el modelo identifica información que falta o instrucciones ambiguas, selecciona una herramienta o método de recuperación (por ejemplo, una consulta de base de datos vectorial (por ejemplo, la búsqueda híbrida de datos privados de Azure AI Search) o una llamada SQL estructurada) para recopilar más contexto.
Evaluación y optimización. Tras revisar los datos devueltos, el modelo decide si hay suficiente información. Si no es suficiente, optimizará la consulta, probará con herramientas diferentes o ajustará su enfoque.
Repita la operación hasta quedar satisfecho. Este ciclo continúa hasta que el modelo determina que tiene suficiente claridad y pruebas para dar una respuesta final bien razonada.
Memoria y estado. A medida que el sistema mantiene el estado y la memoria a través de los pasos, puede recordar intentos anteriores y sus resultados, evitando ciclos repetitivos y tomando decisiones más informadas a medida que avanza.

Con el tiempo, esto crea un sentido evolutivo de la comprensión que permite al modelo manejar tareas complejas de varios pasos sin necesidad de intervención humana continua ni de rediseñar las señales.

Modos de fallo y autocorrección

La autonomía de Agentic RAG también incluye un potente mecanismo de autocorrección. Cuando el sistema llega a un callejón sin salida (por ejemplo, recupera un documento irrelevante o encuentra una consulta con un formato incorrecto), puede:

Iteración y re-consultas. En lugar de devolver respuestas de escaso valor, el modelo prueba nuevas estrategias de búsqueda, reescribe las consultas a la base de datos o examina conjuntos de datos alternativos.
Utilización de herramientas de diagnóstico. El sistema puede llamar a funciones adicionales diseñadas para ayudarle a depurar sus pasos de inferencia o confirmar la corrección de los datos recuperados. herramientas como Azure AI Tracing ayudarán a permitir una observabilidad y supervisión sólidas.
Dependencia de la supervisión manual. En caso de alto riesgo o de fallos repetidos, el modelo puede señalar la incertidumbre y solicitar orientación humana. Una vez que el ser humano proporciona información correctiva, el modelo puede adoptar la experiencia en el futuro.

Este enfoque iterativo y dinámico permite mejorar continuamente el modelo, garantizando que no sea un sistema aislado, sino que pueda aprender de los errores cometidos en una sesión determinada.

Límites del agente

Aunque la RAG Agentic es autónoma en sus tareas, no es equivalente a la IA de propósito general. Sus capacidades "Agentic" se limitan a las herramientas, fuentes de datos y políticas proporcionadas por desarrolladores humanos. No puede inventar sus propias herramientas ni traspasar los límites de un dominio establecido. En cambio, destaca en la orquestación dinámica de los recursos disponibles. Las principales diferencias con otras formas más avanzadas de IA son las siguientes:

Autonomía en áreas específicas. Los sistemas Agentic RAG se centran en la consecución de objetivos definidos por el usuario dentro de dominios conocidos, utilizando estrategias como la reescritura de consultas o la selección de herramientas para mejorar los resultados.
Dependencias de infraestructura. La capacidad del sistema depende de las herramientas y los datos que integren los desarrolladores. No puede traspasar estos límites sin intervención humana.
Respeto al guardarraíl. El código ético, las normas de cumplimiento y las estrategias empresariales siguen siendo importantes. La libertad de los agentes siempre está sujeta a medidas de seguridad y mecanismos de supervisión (¿esperamos?).

Casos prácticos y valor

Agentic RAG brilla en escenarios que requieren optimización iterativa y precisión:

Entorno de "corrección ante todo". En comprobaciones de conformidad, análisis normativos o investigaciones jurídicas, los modelos Agentic pueden verificar los hechos de forma iterativa, consultar múltiples fuentes y reescribir las consultas hasta generar una respuesta minuciosamente examinada.
Interacciones complejas con bases de datos. Cuando se trabaja con datos estructurados, donde las consultas pueden fallar a menudo o necesitan ajustarse, los sistemas pueden utilizar Azure SQL o Microsoft Fabric OneLake para optimizar de forma autónoma sus consultas y garantizar que la recuperación final coincida con la intención del usuario.
Flujo de trabajo ampliado. Las sesiones de larga duración pueden cambiar a medida que se dispone de nueva información, y Agentic RAG puede integrar continuamente nuevos datos, cambiando las estrategias a medida que se aprende más sobre el espacio del problema.

Gobernanza, transparencia y confianza

A medida que estos sistemas adquieren mayor autonomía en su razonamiento, la gobernanza y la transparencia son fundamentales:

Razonamiento interpretable. Los modelos pueden proporcionar una pista de auditoría de las consultas que realizan, las fuentes que consultan y los pasos de razonamiento que siguen para llegar a sus conclusiones.Herramientas como Azure AI Content Safety y Azure AI Tracing / GenAIOps pueden ayudar a mantener la transparencia y mitigar el riesgo.
Control de la desviación y recuperación del equilibrio. Los desarrolladores pueden ajustar las estrategias de recuperación para garantizar que se tienen en cuenta fuentes de datos equilibradas y representativas, y utilizar Azure Machine Learning para personalizar modelos para organizaciones avanzadas de ciencia de datos, auditando regularmente los resultados para detectar sesgos o patrones sesgados.
Supervisión manual y cumplimiento. Para las tareas delicadas, la revisión manual sigue siendo fundamental. Agentic RAG no sustituye al juicio manual en la toma de decisiones de alto riesgo, sino que lo aumenta al ofrecer la opción de una revisión más exhaustiva.

Es vital disponer de herramientas que proporcionen un registro claro de las operaciones. Sin ellas, depurar un proceso de varios pasos puede ser muy difícil. Consulte Literal AI (la empresa que está detrás de Chainlit) para ver un ejemplo de ejecución de un Agente:

llegar a un veredicto

El GAR robótico representa una evolución natural en la forma en que los sistemas de IA abordan las tareas complejas y con gran cantidad de datos. Al adoptar un modelo de interacción cíclica, seleccionar herramientas de forma autónoma y optimizar las consultas hasta obtener resultados de alta calidad, los sistemas están pasando de seguir instrucciones estáticas a tomar decisiones más adaptativas y conscientes del contexto. Aunque siguen estando limitadas por una ética y unas infraestructuras definidas por el ser humano, estas capacidades agenéticas proporcionan interacciones de IA más ricas, dinámicas y, en última instancia, más útiles para las empresas y los usuarios finales.