Introdução geral
O Open Deep Research é um programa de Juntos Uma ferramenta de pesquisa aprofundada desenvolvida e de código aberto pela equipe de IA, hospedada no GitHub. Ela gera relatórios de pesquisa detalhados por meio de um fluxo de trabalho de IA multiagente que imita o processo de pesquisa humana. Os usuários simplesmente inserem um tópico de pesquisa e a ferramenta automaticamente planeja, pesquisa, avalia as informações e escreve um relatório com citações. O projeto é compatível com Python 3.12+ e requer a configuração de chaves de API para usar serviços externos de pesquisa e modelagem de linguagem. É adequado para pesquisa acadêmica, análise de mercado e outros cenários, com ênfase em código aberto e extensão da comunidade, qualquer pessoa pode obter o código gratuitamente e personalizá-lo de acordo com suas necessidades.
Lista de funções
- Geração de um estudo abrangenteGera automaticamente longos relatórios de pesquisa contendo citações com base em tópicos inseridos pelo usuário.
- Coleta de informações em vários estágiosGarantir a qualidade das informações por meio dos estágios de planejamento, pesquisa e autorreflexão.
- verificação de informações de várias fontesSuporte para pesquisas na Web por meio de APIs, como Tavily, HuggingFace etc., com citações de fontes.
- Projeto de arquitetura flexívelOs usuários podem personalizar modelos, ferramentas de pesquisa e estruturas de relatórios para atender a diferentes necessidades.
- Suporte a saída multimodalConteúdo adicional, como imagens de capa, podcasts, etc., pode ser criado automaticamente durante a geração de relatórios.
- Código aberto e orientado pela comunidadeCódigo-fonte: O código é totalmente aberto, permitindo que os usuários modifiquem e ampliem a funcionalidade.
Usando a Ajuda
Processo de instalação
Para usar o Open Deep Research, você precisa configurar o ambiente de tempo de execução localmente ou em um servidor. Abaixo estão as etapas detalhadas de instalação:
- Inspeção de requisitos ambientais
Certifique-se de que o Python 3.12 ou posterior esteja instalado. Recomenda-se um ambiente virtual para evitar conflitos de dependência. Você também precisará instalar ouv
(um pouco mais depip
(Ferramenta de gerenciamento de pacotes mais rápida e eficiente).curl -LsSf https://astral.sh/uv/install.sh | sh
- Repositório de código clone
Clonar o código do projeto localmente a partir do GitHub:git clone https://github.com/togethercomputer/open_deep_research.git cd open_deep_research
- Criar e ativar um ambiente virtual
fazer uso deuv
Crie um ambiente virtual e ative-o:uv venv --python=3.12 source .venv/bin/activate
- Instalação de dependências
Instale todos os pacotes Python necessários para seu projeto:uv pip install -r pyproject.toml uv lock --check
Se você precisar executar o LangGraph avaliação, dependências opcionais podem ser instaladas:
uv pip install -e ".[with-open-deep-research]"
- Configuração de chaves de API
O projeto depende de serviços externos, como Together AI, Tavily e HuggingFace, para pesquisa e inferência de modelos de linguagem. As seguintes variáveis de ambiente precisam ser definidas:export TOGETHER_API_KEY=your_together_api_key export TAVILY_API_KEY=your_tavily_api_key export HUGGINGFACE_TOKEN=your_huggingface_token
comandante-em-chefe (militar)
your_together_api_key
etc. são substituídos pela chave de API real. Você pode se registrar em uma conta e obter a chave no site oficial do provedor de serviços. - Projetos em andamento
Quando a instalação estiver concluída, execute o programa principal para iniciar a tarefa de pesquisa. Por exemplo, gerar um relatório sobre "Ética da Inteligência Artificial":python main.py --topic "人工智能伦理"
O programa executará automaticamente o planejamento, a pesquisa e a geração de relatórios, com o resultado salvo como um arquivo Markdown.
Funções principais
O principal recurso do Open Deep Research é a geração automática de relatórios de pesquisa. Veja abaixo o procedimento detalhado:
- Insira um tópico de pesquisa
O usuário especifica o tópico de pesquisa por meio da linha de comando ou de um script. Exemplo:python main.py --topic "气候变化的影响"
Os tópicos devem ser os mais claros possíveis para que a ferramenta gere relatórios direcionados.
- fase de planejamento
A ferramenta usa primeiro um modelo de linguagem (por exemplo Claude ou GPT) para gerar um esboço de relatório. O usuário pode optar por aceitar o esboço padrão ou fornecer manualmente uma estrutura personalizada. Por exemplo, uma estrutura personalizada poderia ser:{ "title": "气候变化影响研究", "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"] }
Salvo como um arquivo JSON e especificado na linha de comando:
python main.py --topic "气候变化的影响" --structure custom_structure.json
- Recuperação e validação de informações
A ferramenta é passada pelo Tavily A API realiza pesquisas na Web para obter conteúdo da Web relacionado ao tópico. Para cada rodada de pesquisa, o sistema reflete sobre si mesmo, avalia a qualidade das informações e faz perguntas de acompanhamento. Por exemplo, se a pesquisa for "impactos ambientais da mudança climática", o sistema poderá gerar subperguntas, como "dados específicos sobre o aumento do nível do mar". Os resultados da pesquisa são automaticamente desduplicados e as principais informações são extraídas. - Geração de relatórios
O sistema organiza as informações coletadas em um relatório no formato Markdown, incluindo título, capítulo, introdução, corpo e referências. O relatório suporta saída em vários idiomas, o relatório padrão é gerado em inglês e o usuário pode configurar o relatório para gerar versões em chinês ou em outros idiomas. - Extensões multimodais
A ferramenta suporta a geração de imagens de capa e áudio de podcast para acompanhar o relatório. A imagem é criada por um modelo de geração de imagens, como o DALL-E, e o podcast é gerado por um serviço de conversão de texto em fala. Esses recursos exigem configuração adicional da API, por exemplo:export DALLE_API_KEY=your_dalle_api_key
Depois de gerados, os arquivos de imagem e áudio são salvos no diretório de saída.
Operação da função em destaque
- Colaboração com vários agentes
O Open Deep Research usa um fluxo de trabalho de vários agentes, categorizado como um agente de planejamento, um agente de pesquisa e um agente de escrita. Os usuários podem ajustar o comportamento do agente por meio de arquivos de configuração, por exemplo, definindo a profundidade da pesquisa:python main.py --topic "人工智能伦理" --max_search_depth 3
O comando acima aumenta o número de iterações de pesquisa para 3 para obter informações mais detalhadas.
- Expansão da comunidade
Como o projeto é de código aberto, os usuários podem usar o repositório de código para adicionar novos recursos. Por exemplo, integrar uma nova API de pesquisa (como a Pesquisa personalizada do Google) ou oferecer suporte a mais modelos de idiomas. Depois de modificar o código, execute novamente o comando de instalação para que ele entre em vigor.
advertência
- Certifique-se de que as conexões de rede sejam estáveis e que a pesquisa e a inferência de modelos dependam de APIs externas.
- As chaves de API precisam ser armazenadas adequadamente para evitar vazamentos.
- Se você encontrar um conflito de dependência, tente atualizar
uv
ou execute o projeto usando o Docker.
cenário do aplicativo
- pesquisa acadêmica
Estudantes e pesquisadores podem usar o Open Deep Research para gerar rapidamente uma revisão da literatura ou um relatório de histórico de pesquisa. Por exemplo, digite "avanços recentes em computação quântica" e a ferramenta pesquisará bancos de dados acadêmicos e recursos da Web para gerar um relatório detalhado com citações. - análise de mercado
Os analistas de negócios podem usar a ferramenta para estudar as tendências do setor. Por exemplo, digite "Electric Vehicle Market Forecast 2025" e a ferramenta coletará dados de mercado, notícias e relatórios para gerar um documento de análise estruturado. - Educação e treinamento
Os professores podem preparar materiais didáticos para o curso. Por exemplo, digite "Python Programming Basics" e a ferramenta gerará um programa de estudos com tutoriais, código de exemplo e recursos. - criação de conteúdo
Os criadores de conteúdo podem acessar rapidamente inspiração ou informações básicas. Por exemplo, digite "the future of the metaverse" (o futuro do metaverso) e a ferramenta gerará um relatório com tendências tecnológicas e implicações sociais para a escrita.
QA
- Quais modelos de linguagem são compatíveis com o Open Deep Research?
Os modelos da Together AI, OpenAI e HuggingFace são compatíveis por padrão. Os usuários podem adicionar outros modelos por meio de arquivos de configuração, como DeepSeek Ou Claude. - Tenho que pagar para usá-lo?
O projeto em si é gratuito, mas os serviços de API dependentes (por exemplo, Tavily, Together AI) exigem o pagamento de chaves. Os usuários podem escolher entre um serviço alternativo gratuito ou um modelo local. - Como a qualidade dos relatórios pode ser aprimorada?
Aumentar a profundidade da pesquisa (--max_search_depth
) ou usar um modelo de linguagem mais avançado (por exemplo, GPT-4). O fornecimento de uma descrição detalhada do assunto também pode ajudar a gerar relatórios mais precisos. - Ele pode ser usado off-line?
Atualmente, requer uma conexão com a Internet para acessar as APIs de pesquisa e modelo. No futuro, poderá oferecer suporte a modelos locais executados totalmente off-line.