Together Open Deep Research: generación de informes indexados de investigación profunda
Últimos recursos sobre IAPublicado hace 4 meses Círculo de intercambio de inteligencia artificial 1.1K 00
Introducción general
Open Deep Research es un programa de Juntos Una herramienta de investigación en profundidad desarrollada y de código abierto por el equipo de IA, alojada en GitHub. Genera informes de investigación detallados mediante un flujo de trabajo de IA multiagente que imita el proceso de investigación humano. Los usuarios sólo tienen que introducir un tema de investigación y la herramienta automáticamente planifica, busca, evalúa la información y redacta un informe con citas. El proyecto es compatible con Python 3.12+ y requiere la configuración de claves API para utilizar servicios externos de búsqueda y modelización lingüística. Es adecuado para la investigación académica, el análisis de mercado y otros escenarios, con un énfasis en el código abierto y la extensión a la comunidad, cualquiera puede obtener el código de forma gratuita y personalizarlo según sus necesidades.

Lista de funciones
- Elaboración de un estudio exhaustivo: Genera automáticamente largos informes de investigación que contienen citas basadas en temas introducidos por el usuario.
- Recogida de información en varias etapas: Garantizar la calidad de la información a través de las etapas de planificación, búsqueda y autorreflexión.
- verificación de información de múltiples fuentesSoporte para búsquedas web a través de APIs como Tavily, HuggingFace, etc., con citas de fuentes.
- Diseño de arquitectura flexibleLos usuarios pueden personalizar los modelos, las herramientas de búsqueda y las estructuras de los informes en función de sus necesidades.
- Salida multimodalContenido adicional: se pueden crear automáticamente contenidos adicionales, como imágenes de portada, podcasts, etc., mientras se generan los informes.
- Código abierto e impulsado por la comunidadEl código es totalmente abierto, lo que permite a los usuarios modificar y ampliar sus funciones.
Utilizar la ayuda
Proceso de instalación
Para utilizar Open Deep Research, debe configurar el entorno de ejecución localmente o en un servidor. A continuación se detallan los pasos de instalación:
- Inspección de los requisitos medioambientales
Asegúrese de que Python 3.12 o posterior está instalado. Se recomienda un entorno virtual para evitar conflictos de dependencias. También tendrá que instalaruv
(un poco más depip
(Herramienta de gestión de paquetes más rápida y eficaz).curl -LsSf https://astral.sh/uv/install.sh | sh
- Repositorio de código clonado
Clona el código del proyecto localmente desde GitHub:git clone https://github.com/togethercomputer/open_deep_research.git cd open_deep_research
- Crear y activar un entorno virtual
utilizaruv
Crea un entorno virtual y actívalo:uv venv --python=3.12 source .venv/bin/activate
- Instalación de dependencias
Instale todos los paquetes de Python necesarios para su proyecto:uv pip install -r pyproject.toml uv lock --check
Si necesita ejecutar el LangGraph se pueden instalar dependencias opcionales:
uv pip install -e ".[with-open-deep-research]"
- Configuración de claves API
El proyecto depende de servicios externos como Together AI, Tavily y HuggingFace para la búsqueda y la inferencia de modelos lingüísticos. Es necesario configurar las siguientes variables de entorno:export TOGETHER_API_KEY=your_together_api_key export TAVILY_API_KEY=your_tavily_api_key export HUGGINGFACE_TOKEN=your_huggingface_token
comandante en jefe (militar)
your_together_api_key
etc. se sustituyen por la clave API real. Puede registrarse para obtener una cuenta y la clave en el sitio web oficial del proveedor de servicios. - Proyectos en curso
Una vez finalizada la instalación, ejecute el programa principal para iniciar la tarea de investigación. Por ejemplo, generar un informe sobre "Ética de la Inteligencia Artificial":python main.py --topic "人工智能伦理"
El programa realizará automáticamente la planificación, la búsqueda y la generación de informes, y el resultado se guardará como un archivo Markdown.
Funciones principales
La característica principal de Open Deep Research es la generación automática de informes de investigación. A continuación se detalla el procedimiento:
- Introduzca un tema de investigación
El usuario especifica el tema de investigación a través de la línea de comandos o de un script. Ejemplo:python main.py --topic "气候变化的影响"
Los temas deben ser lo más claros posible para que la herramienta genere informes específicos.
- fase de planificación
La herramienta utiliza en primer lugar un modelo lingüístico (p. ej. Claude o GPT) para generar un esquema de informe. El usuario puede optar por aceptar el esquema por defecto o proporcionar manualmente una estructura personalizada. Por ejemplo, una estructura personalizada podría ser:{ "title": "气候变化影响研究", "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"] }
Se guarda como un archivo JSON y se especifica en la línea de comandos:
python main.py --topic "气候变化的影响" --structure custom_structure.json
- Recuperación y validación de la información
La herramienta pasa por el Tavily La API realiza búsquedas en Internet para obtener contenidos web relacionados con el tema. En cada ronda de búsqueda, el sistema reflexiona sobre sí mismo, evalúa la calidad de la información y formula preguntas de seguimiento. Por ejemplo, si la búsqueda es "impactos medioambientales del cambio climático", el sistema puede generar subpreguntas como "datos específicos sobre la subida del nivel del mar". Los resultados de la búsqueda se desduplican automáticamente y se extrae la información clave. - Generación de informes
El sistema organiza la información recopilada en un informe con formato Markdown, que incluye título, capítulo, introducción, cuerpo y referencias. El informe admite salida en varios idiomas; el informe por defecto se genera en inglés, y el usuario puede configurarlo para que genere versiones en chino u otros idiomas. - Extensiones multimodales
La herramienta permite generar imágenes de portada y podcasts de audio para acompañar el informe. La imagen se crea mediante un modelo de generación de imágenes como DALL-E y el podcast se genera mediante un servicio de conversión de texto a voz. Estas funciones requieren una configuración adicional de la API, por ejemplo:export DALLE_API_KEY=your_dalle_api_key
Una vez generados, los archivos de imagen y audio se guardan en el directorio de salida.
Función destacada Operación
- Colaboración multiagente
Open Deep Research utiliza un flujo de trabajo multiagente, categorizado como agente de planificación, agente de búsqueda y agente de escritura. Los usuarios pueden ajustar el comportamiento de los agentes mediante archivos de configuración, por ejemplo, estableciendo la profundidad de búsqueda:python main.py --topic "人工智能伦理" --max_search_depth 3
El comando anterior aumenta el número de iteraciones de búsqueda a 3 para obtener información más detallada.
- Ampliación de la Comunidad
Dado que el proyecto es de código abierto, los usuarios pueden bifurcar el repositorio de código para añadir nuevas funciones. Por ejemplo, integrar una nueva API de búsqueda (como Google Custom Search) o admitir más modelos lingüísticos. Después de modificar el código, vuelva a ejecutar el comando de instalación para que surta efecto.
advertencia
- Asegúrese de que las conexiones de red son estables y de que la búsqueda y la inferencia de modelos dependen de API externas.
- Las claves API deben almacenarse adecuadamente para evitar fugas.
- Si se produce un conflicto de dependencias, pruebe a actualizar
uv
o ejecute el proyecto utilizando Docker.
escenario de aplicación
- investigación académica
Estudiantes e investigadores pueden utilizar Open Deep Research para generar rápidamente una revisión bibliográfica o un informe de antecedentes de investigación. Por ejemplo, escriba "avances recientes en computación cuántica" y la herramienta buscará en bases de datos académicas y recursos web para generar un informe detallado con citas. - análisis del mercado
Los analistas empresariales pueden utilizar la herramienta para estudiar las tendencias del sector. Por ejemplo, introduzca "Previsión del mercado de vehículos eléctricos para 2025" y la herramienta recopilará datos de mercado, noticias e informes para generar un documento de análisis estructurado. - Educación y formación
Los profesores pueden preparar material didáctico para el curso. Por ejemplo, escriba "Conceptos básicos de programación en Python" y la herramienta generará un temario con tutoriales, ejemplos de código y recursos. - creación de contenidos
Los creadores de contenidos pueden acceder rápidamente a inspiración o información de fondo. Por ejemplo, escriba "el futuro del metaverso" y la herramienta generará un informe con tendencias tecnológicas e implicaciones sociales para la escritura.
CONTROL DE CALIDAD
- ¿Qué modelos lingüísticos admite Open Deep Research?
Los modelos de Together AI, OpenAI y HuggingFace son compatibles por defecto. Los usuarios pueden añadir otros modelos mediante archivos de configuración, como DeepSeek O Claude. - ¿Tengo que pagar para utilizarlo?
El proyecto en sí es gratuito, pero los servicios API dependientes (por ejemplo, Tavily, Together AI) exigen el pago de claves. Los usuarios pueden elegir entre un servicio alternativo gratuito o un modelo local. - ¿Cómo mejorar la calidad de los informes?
Aumentar la profundidad de búsqueda (--max_search_depth
) o utilizar un modelo lingüístico más potente (por ejemplo, GPT-4). Proporcionar una descripción detallada del sujeto también puede ayudar a generar informes más precisos. - ¿Se puede utilizar sin conexión?
Actualmente requiere una conexión a Internet para acceder a las API de búsqueda y de modelos. En el futuro podría admitir modelos locales que funcionen completamente sin conexión.
© declaración de copyright
El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.
Artículos relacionados
Sin comentarios...