Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife

Together Open Deep Research: Geração de relatórios de pesquisa profunda indexados

Introdução geral

O Open Deep Research é um programa de Juntos Uma ferramenta de pesquisa aprofundada desenvolvida e de código aberto pela equipe de IA, hospedada no GitHub. Ela gera relatórios de pesquisa detalhados por meio de um fluxo de trabalho de IA multiagente que imita o processo de pesquisa humana. Os usuários simplesmente inserem um tópico de pesquisa e a ferramenta automaticamente planeja, pesquisa, avalia as informações e escreve um relatório com citações. O projeto é compatível com Python 3.12+ e requer a configuração de chaves de API para usar serviços externos de pesquisa e modelagem de linguagem. É adequado para pesquisa acadêmica, análise de mercado e outros cenários, com ênfase em código aberto e extensão da comunidade, qualquer pessoa pode obter o código gratuitamente e personalizá-lo de acordo com suas necessidades.

Together Open Deep Research: Geração de relatórios de pesquisa profunda indexados-1


 

Lista de funções

  • Geração de um estudo abrangenteGera automaticamente longos relatórios de pesquisa contendo citações com base em tópicos inseridos pelo usuário.
  • Coleta de informações em vários estágiosGarantir a qualidade das informações por meio dos estágios de planejamento, pesquisa e autorreflexão.
  • verificação de informações de várias fontesSuporte para pesquisas na Web por meio de APIs, como Tavily, HuggingFace etc., com citações de fontes.
  • Projeto de arquitetura flexívelOs usuários podem personalizar modelos, ferramentas de pesquisa e estruturas de relatórios para atender a diferentes necessidades.
  • Suporte a saída multimodalConteúdo adicional, como imagens de capa, podcasts, etc., pode ser criado automaticamente durante a geração de relatórios.
  • Código aberto e orientado pela comunidadeCódigo-fonte: O código é totalmente aberto, permitindo que os usuários modifiquem e ampliem a funcionalidade.

 

Usando a Ajuda

Processo de instalação

Para usar o Open Deep Research, você precisa configurar o ambiente de tempo de execução localmente ou em um servidor. Abaixo estão as etapas detalhadas de instalação:

  1. Inspeção de requisitos ambientais
    Certifique-se de que o Python 3.12 ou posterior esteja instalado. Recomenda-se um ambiente virtual para evitar conflitos de dependência. Você também precisará instalar o uv(um pouco mais de pip (Ferramenta de gerenciamento de pacotes mais rápida e eficiente).

    curl -LsSf https://astral.sh/uv/install.sh | sh
    
  2. Repositório de código clone
    Clonar o código do projeto localmente a partir do GitHub:

    git clone https://github.com/togethercomputer/open_deep_research.git
    cd open_deep_research
    
  3. Criar e ativar um ambiente virtual
    fazer uso de uv Crie um ambiente virtual e ative-o:

    uv venv --python=3.12
    source .venv/bin/activate
    
  4. Instalação de dependências
    Instale todos os pacotes Python necessários para seu projeto:

    uv pip install -r pyproject.toml
    uv lock --check
    

    Se você precisar executar o LangGraph avaliação, dependências opcionais podem ser instaladas:

    uv pip install -e ".[with-open-deep-research]"
    
  5. Configuração de chaves de API
    O projeto depende de serviços externos, como Together AI, Tavily e HuggingFace, para pesquisa e inferência de modelos de linguagem. As seguintes variáveis de ambiente precisam ser definidas:

    export TOGETHER_API_KEY=your_together_api_key
    export TAVILY_API_KEY=your_tavily_api_key
    export HUGGINGFACE_TOKEN=your_huggingface_token
    

    comandante-em-chefe (militar) your_together_api_key etc. são substituídos pela chave de API real. Você pode se registrar em uma conta e obter a chave no site oficial do provedor de serviços.

  6. Projetos em andamento
    Quando a instalação estiver concluída, execute o programa principal para iniciar a tarefa de pesquisa. Por exemplo, gerar um relatório sobre "Ética da Inteligência Artificial":

    python main.py --topic "人工智能伦理"
    

    O programa executará automaticamente o planejamento, a pesquisa e a geração de relatórios, com o resultado salvo como um arquivo Markdown.

Funções principais

O principal recurso do Open Deep Research é a geração automática de relatórios de pesquisa. Veja abaixo o procedimento detalhado:

  1. Insira um tópico de pesquisa
    O usuário especifica o tópico de pesquisa por meio da linha de comando ou de um script. Exemplo:

    python main.py --topic "气候变化的影响"
    

    Os tópicos devem ser os mais claros possíveis para que a ferramenta gere relatórios direcionados.

  2. fase de planejamento
    A ferramenta usa primeiro um modelo de linguagem (por exemplo Claude ou GPT) para gerar um esboço de relatório. O usuário pode optar por aceitar o esboço padrão ou fornecer manualmente uma estrutura personalizada. Por exemplo, uma estrutura personalizada poderia ser:

    {
    "title": "气候变化影响研究",
    "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"]
    }
    

    Salvo como um arquivo JSON e especificado na linha de comando:

    python main.py --topic "气候变化的影响" --structure custom_structure.json
    
  3. Recuperação e validação de informações
    A ferramenta é passada pelo Tavily A API realiza pesquisas na Web para obter conteúdo da Web relacionado ao tópico. Para cada rodada de pesquisa, o sistema reflete sobre si mesmo, avalia a qualidade das informações e faz perguntas de acompanhamento. Por exemplo, se a pesquisa for "impactos ambientais da mudança climática", o sistema poderá gerar subperguntas, como "dados específicos sobre o aumento do nível do mar". Os resultados da pesquisa são automaticamente desduplicados e as principais informações são extraídas.
  4. Geração de relatórios
    O sistema organiza as informações coletadas em um relatório no formato Markdown, incluindo título, capítulo, introdução, corpo e referências. O relatório suporta saída em vários idiomas, o relatório padrão é gerado em inglês e o usuário pode configurar o relatório para gerar versões em chinês ou em outros idiomas.
  5. Extensões multimodais
    A ferramenta suporta a geração de imagens de capa e áudio de podcast para acompanhar o relatório. A imagem é criada por um modelo de geração de imagens, como o DALL-E, e o podcast é gerado por um serviço de conversão de texto em fala. Esses recursos exigem configuração adicional da API, por exemplo:

    export DALLE_API_KEY=your_dalle_api_key
    

    Depois de gerados, os arquivos de imagem e áudio são salvos no diretório de saída.

Operação da função em destaque

  • Colaboração com vários agentes
    O Open Deep Research usa um fluxo de trabalho de vários agentes, categorizado como um agente de planejamento, um agente de pesquisa e um agente de escrita. Os usuários podem ajustar o comportamento do agente por meio de arquivos de configuração, por exemplo, definindo a profundidade da pesquisa:

    python main.py --topic "人工智能伦理" --max_search_depth 3
    

    O comando acima aumenta o número de iterações de pesquisa para 3 para obter informações mais detalhadas.

  • Expansão da comunidade
    Como o projeto é de código aberto, os usuários podem usar o repositório de código para adicionar novos recursos. Por exemplo, integrar uma nova API de pesquisa (como a Pesquisa personalizada do Google) ou oferecer suporte a mais modelos de idiomas. Depois de modificar o código, execute novamente o comando de instalação para que ele entre em vigor.

advertência

  • Certifique-se de que as conexões de rede sejam estáveis e que a pesquisa e a inferência de modelos dependam de APIs externas.
  • As chaves de API precisam ser armazenadas adequadamente para evitar vazamentos.
  • Se você encontrar um conflito de dependência, tente atualizar uv ou execute o projeto usando o Docker.

 

cenário do aplicativo

  1. pesquisa acadêmica
    Estudantes e pesquisadores podem usar o Open Deep Research para gerar rapidamente uma revisão da literatura ou um relatório de histórico de pesquisa. Por exemplo, digite "avanços recentes em computação quântica" e a ferramenta pesquisará bancos de dados acadêmicos e recursos da Web para gerar um relatório detalhado com citações.
  2. análise de mercado
    Os analistas de negócios podem usar a ferramenta para estudar as tendências do setor. Por exemplo, digite "Electric Vehicle Market Forecast 2025" e a ferramenta coletará dados de mercado, notícias e relatórios para gerar um documento de análise estruturado.
  3. Educação e treinamento
    Os professores podem preparar materiais didáticos para o curso. Por exemplo, digite "Python Programming Basics" e a ferramenta gerará um programa de estudos com tutoriais, código de exemplo e recursos.
  4. criação de conteúdo
    Os criadores de conteúdo podem acessar rapidamente inspiração ou informações básicas. Por exemplo, digite "the future of the metaverse" (o futuro do metaverso) e a ferramenta gerará um relatório com tendências tecnológicas e implicações sociais para a escrita.

 

QA

  1. Quais modelos de linguagem são compatíveis com o Open Deep Research?
    Os modelos da Together AI, OpenAI e HuggingFace são compatíveis por padrão. Os usuários podem adicionar outros modelos por meio de arquivos de configuração, como DeepSeek Ou Claude.
  2. Tenho que pagar para usá-lo?
    O projeto em si é gratuito, mas os serviços de API dependentes (por exemplo, Tavily, Together AI) exigem o pagamento de chaves. Os usuários podem escolher entre um serviço alternativo gratuito ou um modelo local.
  3. Como a qualidade dos relatórios pode ser aprimorada?
    Aumentar a profundidade da pesquisa (--max_search_depth) ou usar um modelo de linguagem mais avançado (por exemplo, GPT-4). O fornecimento de uma descrição detalhada do assunto também pode ajudar a gerar relatórios mais precisos.
  4. Ele pode ser usado off-line?
    Atualmente, requer uma conexão com a Internet para acessar as APIs de pesquisa e modelo. No futuro, poderá oferecer suporte a modelos locais executados totalmente off-line.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Together Open Deep Research: Geração de relatórios de pesquisa profunda indexados
pt_BRPortuguês do Brasil