OpenDeepResearcher: herramienta automatizada de investigación en profundidad para redactar informes de investigación completos.

Introducción general

OpenDeepResearcher es una herramienta automatizada de investigación en profundidad de código abierto diseñada para mejorar la eficiencia de la investigación mediante técnicas de inteligencia artificial. El proyecto fue desarrollado por mshumer y está alojado en GitHub. OpenDeepResearcher aprovecha diversos servicios y tecnologías, como SERPAPI, Jina y OpenRouter, para realizar búsquedas en Google, extracción de contenidos web y análisis contextuales. Su función principal es optimizar continuamente las consultas de búsqueda a través de un bucle de investigación iterativo hasta que el sistema esté seguro de haber recopilado toda la información necesaria. La herramienta también admite el procesamiento asíncrono, el filtrado iterativo y la toma de decisiones basada en LLM, lo que garantiza que el proceso de investigación sea eficiente y exhaustivo.

OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

 

Lista de funciones

  • Ciclo de investigación iterativoEl sistema optimiza la consulta de búsqueda mediante varias iteraciones para garantizar una recopilación exhaustiva de la información.
  • procesamiento asíncrono: La búsqueda, la extracción de páginas web, la evaluación y la extracción contextual se realizan simultáneamente para aumentar la velocidad.
  • filtro de duplicadosAgregación y desduplicación de enlaces en cada iteración para evitar el procesamiento duplicado de los mismos enlaces.
  • LLM Decisiones de conducción: Generación de nuevas consultas de búsqueda, determinación de la utilidad de las páginas, extracción del contexto pertinente y generación de informes finales utilizando un gran modelo lingüístico.
  • Interfaz GradioProporcionar una interfaz de usuario funcional y fácil de usar.

 

Utilizar la ayuda

Proceso de instalación

  1. Clonar o abrir el portátil: Descargue el archivo del cuaderno o directamente en Google Colab Abierto en.
  2. Instalar nidoasyncioEjecutar la primera célula para establecer el nidoasyncio.
  3. Configuración de claves APISustituye los valores del marcador de posición del bloc de notas por la clave de API real, incluido el valor OPENROUTERAPICLAVE, SERPAPIAPIKEY y JINAAPICLAVE.

Pasos de uso

  1. Ejecución de celdas de cuadernoEjecutar todas las celdas secuencialmente. El cuaderno solicita una consulta/tema de investigación y un número máximo opcional de iteraciones (por defecto es 10).
  2. Consulta inicial y generación de búsquedasEl cuaderno utiliza LLM para generar la consulta de búsqueda inicial.
  3. Búsqueda y extracción asíncronasRealiza búsquedas SERPAPI en paralelo, agregando enlaces únicos y procesando cada enlace en paralelo para determinar la utilidad de la página y extraer el contexto relevante.
  4. Optimización iterativaDespués de cada ronda, LLM analiza el contexto de la agregación y decide si son necesarias más consultas de búsqueda.
  5. Elaborar el informe finalInforme final: Una vez que el LLM indica que ya no es necesario seguir investigando (o se ha alcanzado el límite de iteración), se genera un informe final basado en todos los contextos recopilados.
  6. Ver el informe final: El informe de síntesis final se imprimirá en la salida.

Procedimiento de funcionamiento detallado

  • Generación de entradas y consultasEl usuario introduce un tema de investigación y LLM genera hasta cuatro consultas de búsqueda diferentes.
  • Búsqueda y procesamiento simultáneosCada consulta de búsqueda se envía a SERPAPI al mismo tiempo.
  • eliminación de pesoAgregue y desduplique todos los enlaces recuperados en la iteración actual.
  • extracción contextual: Procesa cada enlace para determinar la utilidad de la página y extraer el contexto relevante.
  • Optimización iterativa: Analiza el contexto de la agregación y decide si son necesarias más consultas de búsqueda.
  • Elaboración del informe finalGenerar un informe final consolidado basado en todos los contextos de recogida.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...