Introdução geral
O AI-Scientist-v2 é um sistema inteligente desenvolvido pela empresa japonesa SakanaAI que visa automatizar a pesquisa científica do início ao fim por meio de máquinas. Em abril de 2025, a ferramenta teve seu código aberto no GitHub e foi atualizada com uma primeira versão que adicionou a tecnologia Agentic Tree Search para tornar a exploração mais inteligente. O primeiro artigo gerado que foi escrito inteiramente por IA foi revisado por pares no workshop ICLR 2025. O AI-Scientist-v2 não depende de modelos humanos e é aplicável a uma ampla gama de domínios de aprendizado de máquina, o que o torna adequado para pesquisadores e desenvolvedores.
Lista de funções
- Apresentação de ideias de pesquisaGeração automática de ideias de pesquisa viáveis com base nas instruções de entrada.
- Escrever código experimentalGerar o código necessário para executar experimentos, apoiar o ajuste e a otimização.
- Execução de experimentos e análisesExecuta automaticamente o código, coleta dados e gera gráficos.
- Redação de artigos científicosSaída de um documento bem formatado com base nos resultados do experimento.
- Otimização inteligente de caminhosExplore as melhores opções de pesquisa por meio do Agentic Tree Search.
- Suporte à pesquisa de literaturaAcesso opcional à API do Semantic Scholar para verificar se há novidades e adicionar citações.
- código abertoCódigo completo: O código completo é fornecido, e os usuários podem modificá-lo e expandi-lo.
Usando a Ajuda
O AI-Scientist-v2 requer um certo conhecimento técnico, mas, quando configurado, pode simplificar drasticamente a pesquisa científica. Abaixo estão as etapas detalhadas para ajudar os usuários a começar rapidamente.
Processo de instalação
- Preparação do ambiente
- Requer Linux e uma GPU NVIDIA com suporte a CUDA e PyTorch.
- Crie um ambiente Python 3.11:
conda create -n ai_scientist python=3.11 conda activate ai_scientist
- Instale o PyTorch e o CUDA:
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
- Instalação de dependências
- Código de download:
git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2
- Instalar ferramentas adicionais:
conda install anaconda::poppler # 处理 PDF conda install conda-forge::chktex # 检查论文格式 pip install -r requirements.txt
- Código de download:
- Configuração da API
- Defina a chave da API do Big Model (por exemplo, OpenAI):
export OPENAI_API_KEY='你的密钥'
- Se você usar Claude modelo, instalando suporte adicional:
pip install anthropic[bedrock]
Configure chaves e regiões do AWS:
export AWS_ACCESS_KEY_ID='你的ID' export AWS_SECRET_ACCESS_KEY='你的密钥' export AWS_REGION_NAME='us-west-2'
- Opcionalmente, configure a API do Semantic Scholar:
export S2_API_KEY='你的密钥'
- Defina a chave da API do Big Model (por exemplo, OpenAI):
- ambiente de teste
- Verifique se a GPU está disponível:
python -c "import torch; print(torch.cuda.is_available())"
- exportações
True
Indica que a instalação foi bem-sucedida.
- Verifique se a GPU está disponível:
Como usar os principais recursos
1. geração de ideias de pesquisa
- Vá para o diretório de código e execute:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
- O sistema gera um arquivo JSON que contém o título e a descrição do estudo.
2. execução de experimentos
- Depois que a ideia é gerada, o sistema cria o código experimental (por exemplo
experiment.py
). - Realizar experimentos:
python experiment.py
- Os resultados são salvos no
experiments
no registro, incluindo dados e gráficos.
3. redação de documentos
- Quando o experimento estiver concluído, gere um documento:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
- Produz arquivos LaTeX, que são armazenados no diretório
experiments/timestamp_ideaname/latex
pasta. Compile com o editor LaTeX para visualizá-lo.
4. usando o Agentic Tree Search
- Esse é um recurso essencial da v2 que otimiza os caminhos de estudo.
- Adicionar parâmetros em tempo de execução:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
- gerando
unified_tree_viz.html
Se você tiver um navegador, poderá abri-lo para visualizar o processo de pesquisa.
5. parâmetros de pesquisa da árvore de configuração
- compilador
bfts_config.yaml
Documentação: num_workers
Número de nós para processamento paralelo, por exemplo, 3.steps
Número máximo de nós a serem explorados, por exemplo, 21.num_drafts
Número de direções iniciais de pesquisa.max_debug_depth
Número de tentativas de depuração.
advertência
- segurançaCódigo de execução: O código executa programas escritos por IA, pode chamar pacotes perigosos ou ser conectado em rede, e recomenda-se que seja executado com o Docker.
- Custos (de fabricação, produção etc.)Custo do experimento: Aproximadamente US$ 15 a US$ 20 por experimento, mais US$ 5 para a redação da tese.
- taxa de sucessoA v2 é altamente exploratória, tem uma taxa de sucesso menor do que a v1 e é adequada para pesquisas abertas.
- Problemas de memóriaSe for solicitado "CUDA Out of Memory", altere o modelo pequeno no arquivo JSON.
Essas etapas lhe proporcionam uma experiência completa dos recursos de automação de pesquisa do AI-Scientist-v2.
cenário do aplicativo
- pesquisa acadêmica
Os pesquisadores o utilizam para validar novos algoritmos, gerar os primeiros rascunhos de artigos e economizar tempo. - Aprendizagem educacional
Os alunos o utilizam para simular pesquisas científicas, gerar relatórios e aprender sobre projetos experimentais. - inovação tecnológica
Os desenvolvedores o utilizam para testar novas ideias e gerar rapidamente protótipos de código.
QA
- Quais são os modelos suportados?
Suporte para Claude 3.5 Sonnet, GPT-4o, o1-preview, etc., consultellm.py
Documentação. - Quanto custou o experimento?
Com o Claude 3.5, são cerca de US$ 15 a US$ 20 por sessão, mais US$ 5 para escrever. - O que devo fazer se não conseguir gerar uma tese?
A taxa de sucesso varia de acordo com o modelo e a complexidade da ideia, e os parâmetros podem ser ajustados ou testados novamente com um modelo diferente. - Como faço para adicionar uma nova direção de pesquisa?
existirai_scientist/ideas/
Adicione um novo arquivo JSON no diretório e modifique-o com referência ao exemplo.