r1-reasoning-rag: nuevas ideas para la GAR basadas en el razonamiento recursivo a partir de la información recogida
Base de conocimientos de IAActualizado hace 6 meses Círculo de intercambio de inteligencia artificial 6.6K 00

Hace poco descubrí un proyecto de código abierto que proporciona una gran RAG La idea de que DeepSeek-R1
La capacidad de razonamiento de la combinación de Agentic Workflow
Aplicado a la búsqueda RAG
Dirección del proyecto
https://github.com/deansaco/r1-reasoning-rag.git
El proyecto se está ejecutando mediante una combinación de DeepSeek-R1
yTavily
responder cantando LangGraph
que aplica un mecanismo dinámico de recuperación de información y respuesta basado en la inteligencia artificial que utiliza deepseek
(utilizado como expresión nominal) r1
Razonamiento para recuperar, descartar y sintetizar proactivamente información de la base de conocimientos para responder completamente a una pregunta compleja.
Antiguo vs. Nuevo GAR
La RAG (Retrieval Augmented Generation) tradicional es un poco rígida, normalmente después de procesar la búsqueda, se encuentra algún contenido mediante búsqueda por similitud, y luego se reordena según el grado de coincidencia, y las piezas de información que parecen fiables se dan a un gran modelo de lenguaje (LLM) para generar la respuesta. Pero esto depende especialmente de la calidad del modelo de reordenación, y si el modelo no es sólido, es fácil pasar por alto información importante o pasar el material incorrecto al LLM, y la respuesta resultante no será fiable.
presente . LangGraph
El equipo realizó una gran mejora del proceso, utilizando el DeepSeek-R1
La potente capacidad de razonamiento de la IA ha transformado el anterior método de filtrado inmóvil en un proceso más flexible y dinámico que puede ajustarse en función de la situación. A esto lo llaman "recuperación de agentes", que permite a la IA no sólo encontrar activamente la información que falta, sino también optimizar continuamente su propia estrategia en el proceso de búsqueda de información, formando una especie de efecto de optimización cíclica, de modo que el contenido entregado al LLM será más preciso.
En realidad, esta mejora aplica los conceptos del razonamiento en tiempo de prueba ampliado desde dentro del modelo a la recuperación RAG, lo que mejora enormemente la precisión y la eficacia de la recuperación. Sin duda, merece la pena que las personas que trabajan con técnicas de recuperación RAG tengan en cuenta este nuevo enfoque.
Tecnología básica y aspectos destacados
DeepSeek-R1 Razonamiento
actualizado DeepSeek-R1
es un potente modelo de inferencia
- Análisis profundo del contenido de la información
- Evaluación de los contenidos existentes
- Identificación de los contenidos que faltan mediante múltiples rondas de razonamiento para mejorar la precisión de los resultados de búsqueda.
Búsqueda instantánea de información en Tavily
Tavily
Proporcionar búsqueda instantánea de información, lo que puede hacer que el modelo grande pasado la información más reciente, ampliando el alcance de los conocimientos del modelo.
- Recuperación dinámica para eliminar la información que falta en lugar de basarse únicamente en datos estáticos.
LangGraph Recuperación recursiva (RR)
a través de Agentic AI
mecanismo para permitir que el gran modelo forme un aprendizaje en bucle cerrado tras múltiples rondas de recuperación e inferencia, con el siguiente proceso general:
- El primer paso es buscar información sobre el problema
- El segundo paso consiste en analizar si la información es suficiente para responder a la pregunta.
- Paso 3 Si la información es insuficiente, haga más averiguaciones
- Paso 4 Filtrar el contenido irrelevante y conservar sólo la información válida
tal 递归式
Mecanismo de recuperación para garantizar que el gran modelo pueda optimizar continuamente los resultados de la consulta, haciendo que la información filtrada sea más completa y precisa.
análisis del código fuente
Desde el código fuente, es un simple tres archivos:agent
yllm
yprompts

Agente
La idea central de esta sección es que create_workflow
esta función
Define esto
workflow
El nodo del add_conditional_edges
Parte de la definición es la arista condicional, y toda la idea del procesamiento es la lógica recursiva del grafo vista al principio
Si no está familiarizado LangGraph
Si lo hace, puede consultar la información.LangGraph
El constructo es una estructura de datos gráfica con nodos y aristas, y sus aristas pueden ser condicionales.
Después de cada recuperación, el gran modelo la examina, filtrando la información inútil (Filter Out Irrelevant Information), reteniendo la información útil (Retain Useful Information) y buscando la información que falta (Identify Missing Information). El proceso se repite hasta encontrar la respuesta deseada.
solicita
Aquí se definen dos claves principales.VALIDATE_RETRIEVAL
Plantilla: se utiliza para verificar que la información recuperada puede responder a la pregunta dada. La plantilla tiene dos variables de entrada: retrieved_context y question. Su objetivo principal es generar una respuesta con formato JSON que determine si contienen o no información que pueda responder a la pregunta en función de los bloques de texto proporcionados.
ANSWER_QUESTION
Plantilla de respuesta a preguntas: Se utiliza para ordenar a un agente de respuesta a preguntas que responda a una pregunta basándose en un bloque de texto proporcionado. La plantilla también tiene dos variables de entrada: retrieved_context y question. Su objetivo principal es proporcionar una respuesta directa y concisa basada en la información de contexto proporcionada.

llm
Aquí es sencillo definir el uso de r1
modelización

Es posible cambiar a modelos suministrados por otros proveedores, por ejemplo openrouter
gratis r1
modelización

efecto de prueba
He escrito aquí un script independiente que no utiliza el del proyecto, preguntando por el 《哪吒2》中哪吒的师傅的师傅是谁

Primero llamará a la búsqueda para buscar la información, luego empezará a verificar el

Entonces empezará a analizar y obtendrá 哪吒的师父是太乙真人
Esta información es válida, pero también encontramos que falta información La identidad específica o el nombre del maestro de Taiyi (es decir, el maestro de Nezha).

A continuación, busca la información que falta y sigue analizando y verificando la información obtenida.

Más tarde me informó de un error porque la red estaba caída, pero como se puede ver en la imagen de arriba, debería haber sido capaz de encontrar este dato clave
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...