Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

AI-Scientist-v2: pesquisa científica autônoma e redação de artigos

Introdução geral

O AI-Scientist-v2 é um sistema inteligente desenvolvido pela empresa japonesa SakanaAI que visa automatizar a pesquisa científica do início ao fim por meio de máquinas. Em abril de 2025, a ferramenta teve seu código aberto no GitHub e foi atualizada com uma primeira versão que adicionou a tecnologia Agentic Tree Search para tornar a exploração mais inteligente. O primeiro artigo gerado que foi escrito inteiramente por IA foi revisado por pares no workshop ICLR 2025. O AI-Scientist-v2 não depende de modelos humanos e é aplicável a uma ampla gama de domínios de aprendizado de máquina, o que o torna adequado para pesquisadores e desenvolvedores.

AI-Scientist-v2: conclusão autônoma de pesquisa científica e redação de tese-1


 

Lista de funções

  • Apresentação de ideias de pesquisaGeração automática de ideias de pesquisa viáveis com base nas instruções de entrada.
  • Escrever código experimentalGerar o código necessário para executar experimentos, apoiar o ajuste e a otimização.
  • Execução de experimentos e análisesExecuta automaticamente o código, coleta dados e gera gráficos.
  • Redação de artigos científicosSaída de um documento bem formatado com base nos resultados do experimento.
  • Otimização inteligente de caminhosExplore as melhores opções de pesquisa por meio do Agentic Tree Search.
  • Suporte à pesquisa de literaturaAcesso opcional à API do Semantic Scholar para verificar se há novidades e adicionar citações.
  • código abertoCódigo completo: O código completo é fornecido, e os usuários podem modificá-lo e expandi-lo.

 

Usando a Ajuda

O AI-Scientist-v2 requer um certo conhecimento técnico, mas, quando configurado, pode simplificar drasticamente a pesquisa científica. Abaixo estão as etapas detalhadas para ajudar os usuários a começar rapidamente.

Processo de instalação

  1. Preparação do ambiente
    • Requer Linux e uma GPU NVIDIA com suporte a CUDA e PyTorch.
    • Crie um ambiente Python 3.11:
      conda create -n ai_scientist python=3.11
      conda activate ai_scientist
      
    • Instale o PyTorch e o CUDA:
      conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
      
  2. Instalação de dependências
    • Código de download:
      git clone https://github.com/SakanaAI/AI-Scientist-v2.git
      cd AI-Scientist-v2
      
    • Instalar ferramentas adicionais:
      conda install anaconda::poppler  # 处理 PDF
      conda install conda-forge::chktex  # 检查论文格式
      pip install -r requirements.txt
      
  3. Configuração da API
    • Defina a chave da API do Big Model (por exemplo, OpenAI):
      export OPENAI_API_KEY='你的密钥'
      
    • Se você usar Claude modelo, instalando suporte adicional:
      pip install anthropic[bedrock]
      

      Configure chaves e regiões do AWS:

      export AWS_ACCESS_KEY_ID='你的ID'
      export AWS_SECRET_ACCESS_KEY='你的密钥'
      export AWS_REGION_NAME='us-west-2'
      
    • Opcionalmente, configure a API do Semantic Scholar:
      export S2_API_KEY='你的密钥'
      
  4. ambiente de teste
    • Verifique se a GPU está disponível:
      python -c "import torch; print(torch.cuda.is_available())"
      
    • exportações True Indica que a instalação foi bem-sucedida.

Como usar os principais recursos

1. geração de ideias de pesquisa

  • Vá para o diretório de código e execute:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
  • O sistema gera um arquivo JSON que contém o título e a descrição do estudo.

2. execução de experimentos

  • Depois que a ideia é gerada, o sistema cria o código experimental (por exemplo experiment.py).
  • Realizar experimentos:
python experiment.py
  • Os resultados são salvos no experiments no registro, incluindo dados e gráficos.

3. redação de documentos

  • Quando o experimento estiver concluído, gere um documento:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
  • Produz arquivos LaTeX, que são armazenados no diretório experiments/timestamp_ideaname/latex pasta. Compile com o editor LaTeX para visualizá-lo.

4. usando o Agentic Tree Search

  • Esse é um recurso essencial da v2 que otimiza os caminhos de estudo.
  • Adicionar parâmetros em tempo de execução:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
  • gerando unified_tree_viz.htmlSe você tiver um navegador, poderá abri-lo para visualizar o processo de pesquisa.

5. parâmetros de pesquisa da árvore de configuração

  • compilador bfts_config.yaml Documentação:
  • num_workersNúmero de nós para processamento paralelo, por exemplo, 3.
  • stepsNúmero máximo de nós a serem explorados, por exemplo, 21.
  • num_draftsNúmero de direções iniciais de pesquisa.
  • max_debug_depthNúmero de tentativas de depuração.

advertência

  • segurançaCódigo de execução: O código executa programas escritos por IA, pode chamar pacotes perigosos ou ser conectado em rede, e recomenda-se que seja executado com o Docker.
  • Custos (de fabricação, produção etc.)Custo do experimento: Aproximadamente US$ 15 a US$ 20 por experimento, mais US$ 5 para a redação da tese.
  • taxa de sucessoA v2 é altamente exploratória, tem uma taxa de sucesso menor do que a v1 e é adequada para pesquisas abertas.
  • Problemas de memóriaSe for solicitado "CUDA Out of Memory", altere o modelo pequeno no arquivo JSON.

Essas etapas lhe proporcionam uma experiência completa dos recursos de automação de pesquisa do AI-Scientist-v2.

 

cenário do aplicativo

  1. pesquisa acadêmica
    Os pesquisadores o utilizam para validar novos algoritmos, gerar os primeiros rascunhos de artigos e economizar tempo.
  2. Aprendizagem educacional
    Os alunos o utilizam para simular pesquisas científicas, gerar relatórios e aprender sobre projetos experimentais.
  3. inovação tecnológica
    Os desenvolvedores o utilizam para testar novas ideias e gerar rapidamente protótipos de código.

 

QA

  1. Quais são os modelos suportados?
    Suporte para Claude 3.5 Sonnet, GPT-4o, o1-preview, etc., consulte llm.py Documentação.
  2. Quanto custou o experimento?
    Com o Claude 3.5, são cerca de US$ 15 a US$ 20 por sessão, mais US$ 5 para escrever.
  3. O que devo fazer se não conseguir gerar uma tese?
    A taxa de sucesso varia de acordo com o modelo e a complexidade da ideia, e os parâmetros podem ser ajustados ou testados novamente com um modelo diferente.
  4. Como faço para adicionar uma nova direção de pesquisa?
    existir ai_scientist/ideas/ Adicione um novo arquivo JSON no diretório e modifique-o com referência ao exemplo.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " AI-Scientist-v2: pesquisa científica autônoma e redação de artigos
pt_BRPortuguês do Brasil