Together Open Deep Research: generación de informes indexados de investigación profunda

Introducción general

Open Deep Research es un programa de Juntos Una herramienta de investigación en profundidad desarrollada y de código abierto por el equipo de IA, alojada en GitHub. Genera informes de investigación detallados mediante un flujo de trabajo de IA multiagente que imita el proceso de investigación humano. Los usuarios sólo tienen que introducir un tema de investigación y la herramienta automáticamente planifica, busca, evalúa la información y redacta un informe con citas. El proyecto es compatible con Python 3.12+ y requiere la configuración de claves API para utilizar servicios externos de búsqueda y modelización lingüística. Es adecuado para la investigación académica, el análisis de mercado y otros escenarios, con un énfasis en el código abierto y la extensión a la comunidad, cualquiera puede obtener el código de forma gratuita y personalizarlo según sus necesidades.

Together Open Deep Research:生成带索引的深度研究报告

 

Lista de funciones

  • Elaboración de un estudio exhaustivo: Genera automáticamente largos informes de investigación que contienen citas basadas en temas introducidos por el usuario.
  • Recogida de información en varias etapas: Garantizar la calidad de la información a través de las etapas de planificación, búsqueda y autorreflexión.
  • verificación de información de múltiples fuentesSoporte para búsquedas web a través de APIs como Tavily, HuggingFace, etc., con citas de fuentes.
  • Diseño de arquitectura flexibleLos usuarios pueden personalizar los modelos, las herramientas de búsqueda y las estructuras de los informes en función de sus necesidades.
  • Salida multimodalContenido adicional: se pueden crear automáticamente contenidos adicionales, como imágenes de portada, podcasts, etc., mientras se generan los informes.
  • Código abierto e impulsado por la comunidadEl código es totalmente abierto, lo que permite a los usuarios modificar y ampliar sus funciones.

 

Utilizar la ayuda

Proceso de instalación

Para utilizar Open Deep Research, debe configurar el entorno de ejecución localmente o en un servidor. A continuación se detallan los pasos de instalación:

  1. Inspección de los requisitos medioambientales
    Asegúrese de que Python 3.12 o posterior está instalado. Se recomienda un entorno virtual para evitar conflictos de dependencias. También tendrá que instalar uv(un poco más de pip (Herramienta de gestión de paquetes más rápida y eficaz).

    curl -LsSf https://astral.sh/uv/install.sh | sh
    
  2. Repositorio de código clonado
    Clona el código del proyecto localmente desde GitHub:

    git clone https://github.com/togethercomputer/open_deep_research.git
    cd open_deep_research
    
  3. Crear y activar un entorno virtual
    utilizar uv Crea un entorno virtual y actívalo:

    uv venv --python=3.12
    source .venv/bin/activate
    
  4. Instalación de dependencias
    Instale todos los paquetes de Python necesarios para su proyecto:

    uv pip install -r pyproject.toml
    uv lock --check
    

    Si necesita ejecutar el LangGraph se pueden instalar dependencias opcionales:

    uv pip install -e ".[with-open-deep-research]"
    
  5. Configuración de claves API
    El proyecto depende de servicios externos como Together AI, Tavily y HuggingFace para la búsqueda y la inferencia de modelos lingüísticos. Es necesario configurar las siguientes variables de entorno:

    export TOGETHER_API_KEY=your_together_api_key
    export TAVILY_API_KEY=your_tavily_api_key
    export HUGGINGFACE_TOKEN=your_huggingface_token
    

    comandante en jefe (militar) your_together_api_key etc. se sustituyen por la clave API real. Puede registrarse para obtener una cuenta y la clave en el sitio web oficial del proveedor de servicios.

  6. Proyectos en curso
    Una vez finalizada la instalación, ejecute el programa principal para iniciar la tarea de investigación. Por ejemplo, generar un informe sobre "Ética de la Inteligencia Artificial":

    python main.py --topic "人工智能伦理"
    

    El programa realizará automáticamente la planificación, la búsqueda y la generación de informes, y el resultado se guardará como un archivo Markdown.

Funciones principales

La característica principal de Open Deep Research es la generación automática de informes de investigación. A continuación se detalla el procedimiento:

  1. Introduzca un tema de investigación
    El usuario especifica el tema de investigación a través de la línea de comandos o de un script. Ejemplo:

    python main.py --topic "气候变化的影响"
    

    Los temas deben ser lo más claros posible para que la herramienta genere informes específicos.

  2. fase de planificación
    La herramienta utiliza en primer lugar un modelo lingüístico (p. ej. Claude o GPT) para generar un esquema de informe. El usuario puede optar por aceptar el esquema por defecto o proporcionar manualmente una estructura personalizada. Por ejemplo, una estructura personalizada podría ser:

    {
    "title": "气候变化影响研究",
    "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"]
    }
    

    Se guarda como un archivo JSON y se especifica en la línea de comandos:

    python main.py --topic "气候变化的影响" --structure custom_structure.json
    
  3. Recuperación y validación de la información
    La herramienta pasa por el Tavily La API realiza búsquedas en Internet para obtener contenidos web relacionados con el tema. En cada ronda de búsqueda, el sistema reflexiona sobre sí mismo, evalúa la calidad de la información y formula preguntas de seguimiento. Por ejemplo, si la búsqueda es "impactos medioambientales del cambio climático", el sistema puede generar subpreguntas como "datos específicos sobre la subida del nivel del mar". Los resultados de la búsqueda se desduplican automáticamente y se extrae la información clave.
  4. Generación de informes
    El sistema organiza la información recopilada en un informe con formato Markdown, que incluye título, capítulo, introducción, cuerpo y referencias. El informe admite salida en varios idiomas; el informe por defecto se genera en inglés, y el usuario puede configurarlo para que genere versiones en chino u otros idiomas.
  5. Extensiones multimodales
    La herramienta permite generar imágenes de portada y podcasts de audio para acompañar el informe. La imagen se crea mediante un modelo de generación de imágenes como DALL-E y el podcast se genera mediante un servicio de conversión de texto a voz. Estas funciones requieren una configuración adicional de la API, por ejemplo:

    export DALLE_API_KEY=your_dalle_api_key
    

    Una vez generados, los archivos de imagen y audio se guardan en el directorio de salida.

Función destacada Operación

  • Colaboración multiagente
    Open Deep Research utiliza un flujo de trabajo multiagente, categorizado como agente de planificación, agente de búsqueda y agente de escritura. Los usuarios pueden ajustar el comportamiento de los agentes mediante archivos de configuración, por ejemplo, estableciendo la profundidad de búsqueda:

    python main.py --topic "人工智能伦理" --max_search_depth 3
    

    El comando anterior aumenta el número de iteraciones de búsqueda a 3 para obtener información más detallada.

  • Ampliación de la Comunidad
    Dado que el proyecto es de código abierto, los usuarios pueden bifurcar el repositorio de código para añadir nuevas funciones. Por ejemplo, integrar una nueva API de búsqueda (como Google Custom Search) o admitir más modelos lingüísticos. Después de modificar el código, vuelva a ejecutar el comando de instalación para que surta efecto.

advertencia

  • Asegúrese de que las conexiones de red son estables y de que la búsqueda y la inferencia de modelos dependen de API externas.
  • Las claves API deben almacenarse adecuadamente para evitar fugas.
  • Si se produce un conflicto de dependencias, pruebe a actualizar uv o ejecute el proyecto utilizando Docker.

 

escenario de aplicación

  1. investigación académica
    Estudiantes e investigadores pueden utilizar Open Deep Research para generar rápidamente una revisión bibliográfica o un informe de antecedentes de investigación. Por ejemplo, escriba "avances recientes en computación cuántica" y la herramienta buscará en bases de datos académicas y recursos web para generar un informe detallado con citas.
  2. análisis del mercado
    Los analistas empresariales pueden utilizar la herramienta para estudiar las tendencias del sector. Por ejemplo, introduzca "Previsión del mercado de vehículos eléctricos para 2025" y la herramienta recopilará datos de mercado, noticias e informes para generar un documento de análisis estructurado.
  3. Educación y formación
    Los profesores pueden preparar material didáctico para el curso. Por ejemplo, escriba "Conceptos básicos de programación en Python" y la herramienta generará un temario con tutoriales, ejemplos de código y recursos.
  4. creación de contenidos
    Los creadores de contenidos pueden acceder rápidamente a inspiración o información de fondo. Por ejemplo, escriba "el futuro del metaverso" y la herramienta generará un informe con tendencias tecnológicas e implicaciones sociales para la escritura.

 

CONTROL DE CALIDAD

  1. ¿Qué modelos lingüísticos admite Open Deep Research?
    Los modelos de Together AI, OpenAI y HuggingFace son compatibles por defecto. Los usuarios pueden añadir otros modelos mediante archivos de configuración, como DeepSeek O Claude.
  2. ¿Tengo que pagar para utilizarlo?
    El proyecto en sí es gratuito, pero los servicios API dependientes (por ejemplo, Tavily, Together AI) exigen el pago de claves. Los usuarios pueden elegir entre un servicio alternativo gratuito o un modelo local.
  3. ¿Cómo mejorar la calidad de los informes?
    Aumentar la profundidad de búsqueda (--max_search_depth) o utilizar un modelo lingüístico más potente (por ejemplo, GPT-4). Proporcionar una descripción detallada del sujeto también puede ayudar a generar informes más precisos.
  4. ¿Se puede utilizar sin conexión?
    Actualmente requiere una conexión a Internet para acceder a las API de búsqueda y de modelos. En el futuro podría admitir modelos locales que funcionen completamente sin conexión.
© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...