r1-reasoning-rag: nuevas ideas para la GAR basadas en el razonamiento recursivo a partir de la información recogida

Base de conocimientos de IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

34.7K 00

Hace poco descubrí un proyecto de código abierto que proporciona una gran RAG La idea de que DeepSeek-R1 La capacidad de razonamiento de la combinación de Agentic Workflow Aplicado a la búsqueda RAG

Dirección del proyecto
https://github.com/deansaco/r1-reasoning-rag.git

El proyecto se está ejecutando mediante una combinación de DeepSeek-R1yTavily responder cantando LangGraphque aplica un mecanismo dinámico de recuperación de información y respuesta basado en la inteligencia artificial que utiliza deepseek (utilizado como expresión nominal) r1 Razonamiento para recuperar, descartar y sintetizar proactivamente información de la base de conocimientos para responder completamente a una pregunta compleja.

Antiguo vs. Nuevo GAR

La RAG (Retrieval Augmented Generation) tradicional es un poco rígida, normalmente después de procesar la búsqueda, se encuentra algún contenido mediante búsqueda por similitud, y luego se reordena según el grado de coincidencia, y las piezas de información que parecen fiables se dan a un gran modelo de lenguaje (LLM) para generar la respuesta. Pero esto depende especialmente de la calidad del modelo de reordenación, y si el modelo no es sólido, es fácil pasar por alto información importante o pasar el material incorrecto al LLM, y la respuesta resultante no será fiable.

presente . LangGraph El equipo realizó una gran mejora del proceso, utilizando el DeepSeek-R1 La potente capacidad de razonamiento de la IA ha transformado el anterior método de filtrado inmóvil en un proceso más flexible y dinámico que puede ajustarse en función de la situación. A esto lo llaman "recuperación de agentes", que permite a la IA no sólo encontrar activamente la información que falta, sino también optimizar continuamente su propia estrategia en el proceso de búsqueda de información, formando una especie de efecto de optimización cíclica, de modo que el contenido entregado al LLM será más preciso.

En realidad, esta mejora aplica los conceptos del razonamiento en tiempo de prueba ampliado desde dentro del modelo a la recuperación RAG, lo que mejora enormemente la precisión y la eficacia de la recuperación. Sin duda, merece la pena que las personas que trabajan con técnicas de recuperación RAG tengan en cuenta este nuevo enfoque.

Tecnología básica y aspectos destacados

DeepSeek-R1 Razonamiento

actualizado DeepSeek-R1 es un potente modelo de inferencia

Análisis profundo del contenido de la información
Evaluación de los contenidos existentes
Identificación de los contenidos que faltan mediante múltiples rondas de razonamiento para mejorar la precisión de los resultados de búsqueda.

Búsqueda instantánea de información en Tavily

Tavily Proporcionar búsqueda instantánea de información, lo que puede hacer que el modelo grande pasado la información más reciente, ampliando el alcance de los conocimientos del modelo.

Recuperación dinámica para eliminar la información que falta en lugar de basarse únicamente en datos estáticos.

LangGraph Recuperación recursiva (RR)

a través de Agentic AI mecanismo para permitir que el gran modelo forme un aprendizaje en bucle cerrado tras múltiples rondas de recuperación e inferencia, con el siguiente proceso general:

El primer paso es buscar información sobre el problema
El segundo paso consiste en analizar si la información es suficiente para responder a la pregunta.
Paso 3 Si la información es insuficiente, haga más averiguaciones
Paso 4 Filtrar el contenido irrelevante y conservar sólo la información válida

tal 递归式 Mecanismo de recuperación para garantizar que el gran modelo pueda optimizar continuamente los resultados de la consulta, haciendo que la información filtrada sea más completa y precisa.

análisis del código fuente

Desde el código fuente, es un simple tres archivos:agentyllmyprompts

Agente

La idea central de esta sección es que create_workflow esta función

r1-reasoning-rag：根据收集信息递归推理的 RAG 新思路 Define esto workflow El nodo del add_conditional_edges Parte de la definición es la arista condicional, y toda la idea del procesamiento es la lógica recursiva del grafo vista al principio

Si no está familiarizado LangGraph Si lo hace, puede consultar la información.
LangGraph El constructo es una estructura de datos gráfica con nodos y aristas, y sus aristas pueden ser condicionales.

Después de cada recuperación, el gran modelo la examina, filtrando la información inútil (Filter Out Irrelevant Information), reteniendo la información útil (Retain Useful Information) y buscando la información que falta (Identify Missing Information). El proceso se repite hasta encontrar la respuesta deseada.

solicita

Aquí se definen dos claves principales.VALIDATE_RETRIEVAL Plantilla: se utiliza para verificar que la información recuperada puede responder a la pregunta dada. La plantilla tiene dos variables de entrada: retrieved_context y question. Su objetivo principal es generar una respuesta con formato JSON que determine si contienen o no información que pueda responder a la pregunta en función de los bloques de texto proporcionados. r1-reasoning-rag：根据收集信息递归推理的 RAG 新思路

ANSWER_QUESTIONPlantilla de respuesta a preguntas: Se utiliza para ordenar a un agente de respuesta a preguntas que responda a una pregunta basándose en un bloque de texto proporcionado. La plantilla también tiene dos variables de entrada: retrieved_context y question. Su objetivo principal es proporcionar una respuesta directa y concisa basada en la información de contexto proporcionada.

llm

Aquí es sencillo definir el uso de r1 modelización

Es posible cambiar a modelos suministrados por otros proveedores, por ejemplo openrouter gratis r1 modelización

efecto de prueba

He escrito aquí un script independiente que no utiliza el del proyecto, preguntando por el 《哪吒2》中哪吒的师傅的师傅是谁

Primero llamará a la búsqueda para buscar la información, luego empezará a verificar el

Entonces empezará a analizar y obtendrá 哪吒的师父是太乙真人 Esta información es válida, pero también encontramos que falta información La identidad específica o el nombre del maestro de Taiyi (es decir, el maestro de Nezha).

A continuación, busca la información que falta y sigue analizando y verificando la información obtenida.

Más tarde me informó de un error porque la red estaba caída, pero como se puede ver en la imagen de arriba, debería haber sido capaz de encontrar este dato clave