Inventario tecnológico de investigación profunda Un paradigma para las aplicaciones LLM más avanzado que las GAR

Base de conocimientos de IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

62.7K 00

Después de que la herramienta Deep Research de OpenAI surgiera de la nada, todos los principales proveedores lanzaron sus propias herramientas de Deep Research. La llamada Deep Research se compara con la búsqueda ordinaria, en la que una simple recuperación RAG genera generalmente una sola ronda de recuperación. Sin embargo, la Deep Research puede buscar, analizar, recuperar y volver a analizar en función de un tema, igual que un ser humano, hasta alcanzar el objetivo de la investigación. Desde este punto de vista, se trata esencialmente de una versión mejorada de la aplicación RAG, el uso de ReAct/Plan And Solve y otros modos de construcción del Agente de dominio colgante, con la planificación y generación de descomposición de artículos, adquisición de información y capacidades de análisis.

En principio es muy simple, pero quieren lograr un privado para satisfacer sus propias necesidades de negocio del producto terminado, los detalles reales de ingeniería, así como el efecto de la optimización es bastante complejo, por lo que algunos andamios del proyecto o plataforma de desarrollo de productos terminados es particularmente importante, que es el mismo que el GAR, habrá más y más tales marcos de desarrollo aparecen.

Hoy en día, en la introducción de varios Deep Research implementación de código abierto , en nombre de las dos ideas de implementación , uno se basa en la implementación marco de orquestación existente , como Langchain Langgraph , el otro está diseñado específicamente para las características de desarrollo de la investigación profunda . A través de ellos no sólo se puede construir rápidamente aplicaciones de investigación profunda, sino también comprender los detalles de la aplicación de estos marcos y la selección específica, tales como qué buscar, qué utilizar el almacenamiento, ¿cuál es la palabra clave, etc, que es muy útil para nuestra propia aplicación de la función de referencia.

1. Langchain Open DeepResearch

Se trata de una implementación de demostración oficial de LangChain, basada en la plataforma LangGraph Construya todo el flujo de procesamiento. Integrando múltiples API como Tavily , Perplejidad, que permite la búsqueda y la recopilación de información. Los usuarios pueden establecer la profundidad de la búsqueda para cada capítulo, incluido el número de iteraciones para escribir, reflexionar, buscar y reescribir, así como proporcionar comentarios sobre el plan del capítulo del informe e iterar hasta quedar satisfechos.

Deep Research 技术盘点！比RAG更高级的LLM应用范式 Mensaje utilizado: https://github.com/langchain-ai/open_deep_research/blob/main/src/open_deep_research/prompts.py

Dirección del proyecto: https://github.com/langchain-ai/open_deep_research同类型的有Dify等框架编排的Deep Solicitud de investigación.

2. Investigación abierta en profundidad

Open Deep Research es una de las muchas implementaciones de fontanería. Deconstruye el proceso DeepSearch y admite procesos de investigación automáticos y semiautomáticos. Al admitir diversas interfaces API, no sólo es capaz de recuperar información de la extranet, sino también de recuperar información interna de la empresa para realizar análisis resumidos. Los usuarios pueden elegir distintas plataformas de IA en función de sus necesidades, como Google, OpenAI, Anthropic, DeepSeek, etc., e incluso pueden acceder a modelos locales para lograr una investigación personalizada.

Contiene los tres pasos de la norma Deep ReSearch:

Recuperación de resultados de búsqueda: Obtenga resultados de búsqueda completos para los términos de búsqueda especificados a través de Google Custom Search o Bing Search API (configurable).
Extracción de contenido: JinaAI se utiliza para extraer y procesar el contenido de los resultados de búsqueda seleccionados para garantizar la precisión y relevancia de la información.
Generación de informes: utilizando modelos de IA seleccionados por el usuario (p. ej. Géminis (GPT-4, Sonnet, etc.) genera informes detallados sobre los resultados de búsqueda cotejados y el contenido extraído, proporcionando análisis en profundidad y perspectivas sobre las indicaciones definidas por el usuario.

A continuación se muestra el Prompt utilizado para generar el informe:

You are a research assistant tasked with creating a comprehensive report based on multiple sources. 
The report should specifically address this request: "${userPrompt}"
Your report should:
1. Have a clear title that reflects the specific analysis requested
2. Begin with a concise executive summary
3. Be organized into relevant sections based on the analysis requested
4. Use markdown formatting for emphasis, lists, and structure
5. Integrate information from sources naturally without explicitly referencing them by number
6. Maintain objectivity while addressing the specific aspects requested in the prompt
7. Compare and contrast the information from each source, noting areas of consensus or points of contention.
8. Showcase key insights, important data, or innovative ideas.
Here are the source articles to analyze:
${articles
.map(
(article) => `
Title: ${article.title}
URL: ${article.url}
Content: ${article.content}
---
`
)
.join('n')}
Format the report as a JSON object with the following structure:
{
"title": "Report title",
"summary": "Executive summary (can include markdown)",
"sections": [
{
"title": "Section title",
"content": "Section content with markdown formatting"
}
]
}
Use markdown formatting in the content to improve readability:
- Use **bold** for emphasis
- Use bullet points and numbered lists where appropriate
- Use headings and subheadings with # syntax
- Include code blocks if relevant
- Use > for quotations
- Use --- for horizontal rules where appropriate
Important: Do not use phrases like "Source 1" or "According to Source 2". Instead, integrate the information naturally into the narrative or reference sources by their titles when necessary.

El informe generado puede descargarse o almacenarse en la base de conocimientos, pero no cuenta con suficientes fuentes de búsqueda de alta calidad y carece de procesos iterativos y de validación de la investigación, por lo que aún hay margen para mejorar la calidad, pero el proceso general es claro y adecuado para la mejora y el perfeccionamiento continuos sobre esta base.

Dirección del proyecto: https://github.com/btahir/open-deep-research

El mismo tipo también está disponible:

https://github.com/nickscamara/open-deep-research (4.3k)

https://github.com/mshumer/OpenDeepResearcher (2.2k)

https://github.com/assafelovic/gpt-researcher (19k)

https://github.com/zaidmukaddam/scira (6.4k)

https://github.com/jina-ai/node-DeepResearch (2.6k)

Entre ellos, node-DeepResearch para la implementación de investigación profunda de código abierto de jina, puede utilizar directamente su api, y otras interfaces de modelo son tan simples de usar, puede integrar rápidamente en sus propias aplicaciones.

corto

Como se mencionó al principio del artículo, la Investigación Profunda es el resultado de la evolución de la demanda del usuario de acceso de alta calidad a los contenidos, rompiendo el capullo de información de la recomendación pasiva, abandonando la búsqueda tradicional y el resumen, y luego buscar y resumir el proceso ineficiente, bien a través de la automatización. De acuerdo con esta dirección de desarrollo, el modo de adquisición de contenidos tendrá nuevos cambios, lo que supondrá un gran reto para la recomendación de búsqueda tradicional.