AI-Scientist-v2: pesquisa científica autônoma e redação de artigos

Recursos mais recentes de IAPublicado há 4 meses Círculo de compartilhamento de IA

1.7K 00

Introdução geral

O AI-Scientist-v2 é um sistema inteligente desenvolvido pela empresa japonesa SakanaAI que visa automatizar a pesquisa científica do início ao fim por meio de máquinas. Em abril de 2025, a ferramenta teve seu código aberto no GitHub e foi atualizada com uma primeira versão que adicionou a tecnologia Agentic Tree Search para tornar a exploração mais inteligente. O primeiro artigo gerado que foi escrito inteiramente por IA foi revisado por pares no workshop ICLR 2025. O AI-Scientist-v2 não depende de modelos humanos e é aplicável a uma ampla gama de domínios de aprendizado de máquina, o que o torna adequado para pesquisadores e desenvolvedores.

Lista de funções

Apresentação de ideias de pesquisaGeração automática de ideias de pesquisa viáveis com base nas instruções de entrada.
Escrever código experimentalGerar o código necessário para executar experimentos, apoiar o ajuste e a otimização.
Execução de experimentos e análisesExecuta automaticamente o código, coleta dados e gera gráficos.
Redação de artigos científicosSaída de um documento bem formatado com base nos resultados do experimento.
Otimização inteligente de caminhosExplore as melhores opções de pesquisa por meio do Agentic Tree Search.
Suporte à pesquisa de literaturaAcesso opcional à API do Semantic Scholar para verificar se há novidades e adicionar citações.
código abertoCódigo completo: O código completo é fornecido, e os usuários podem modificá-lo e expandi-lo.

Usando a Ajuda

O AI-Scientist-v2 requer um certo conhecimento técnico, mas, quando configurado, pode simplificar drasticamente a pesquisa científica. Abaixo estão as etapas detalhadas para ajudar os usuários a começar rapidamente.

Processo de instalação

Preparação do ambiente

Requer Linux e uma GPU NVIDIA com suporte a CUDA e PyTorch.

Crie um ambiente Python 3.11:

conda create -n ai_scientist python=3.11
conda activate ai_scientist

Instale o PyTorch e o CUDA:

conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

Instalação de dependências

Código de download:

git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2

Instalar ferramentas adicionais:

conda install anaconda::poppler  # 处理 PDF
conda install conda-forge::chktex  # 检查论文格式
pip install -r requirements.txt

Configuração da API

Defina a chave da API do Big Model (por exemplo, OpenAI):
```
export OPENAI_API_KEY='你的密钥'
```

Se você usar Claude modelo, instalando suporte adicional:

pip install anthropic[bedrock]

Configure chaves e regiões do AWS:

export AWS_ACCESS_KEY_ID='你的ID'
export AWS_SECRET_ACCESS_KEY='你的密钥'
export AWS_REGION_NAME='us-west-2'

Opcionalmente, configure a API do Semantic Scholar:
```
export S2_API_KEY='你的密钥'
```

ambiente de teste
- Verifique se a GPU está disponível:
```
python -c "import torch; print(torch.cuda.is_available())"
```
- exportações True Indica que a instalação foi bem-sucedida.

Como usar os principais recursos

1. geração de ideias de pesquisa

Vá para o diretório de código e execute:

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"

O sistema gera um arquivo JSON que contém o título e a descrição do estudo.

2. execução de experimentos

Depois que a ideia é gerada, o sistema cria o código experimental (por exemplo experiment.py).
Realizar experimentos:

python experiment.py

Os resultados são salvos no experiments no registro, incluindo dados e gráficos.

3. redação de documentos

Quando o experimento estiver concluído, gere um documento:

python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"

Produz arquivos LaTeX, que são armazenados no diretório experiments/timestamp_ideaname/latex pasta. Compile com o editor LaTeX para visualizá-lo.

4. usando o Agentic Tree Search

Esse é um recurso essencial da v2 que otimiza os caminhos de estudo.
Adicionar parâmetros em tempo de execução:

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search

gerando unified_tree_viz.htmlSe você tiver um navegador, poderá abri-lo para visualizar o processo de pesquisa.

5. parâmetros de pesquisa da árvore de configuração

compilador bfts_config.yaml Documentação:
num_workersNúmero de nós para processamento paralelo, por exemplo, 3.
stepsNúmero máximo de nós a serem explorados, por exemplo, 21.
num_draftsNúmero de direções iniciais de pesquisa.
max_debug_depthNúmero de tentativas de depuração.

advertência

segurançaCódigo de execução: O código executa programas escritos por IA, pode chamar pacotes perigosos ou ser conectado em rede, e recomenda-se que seja executado com o Docker.
Custos (de fabricação, produção etc.)Custo do experimento: Aproximadamente US$ 15 a US$ 20 por experimento, mais US$ 5 para a redação da tese.
taxa de sucessoA v2 é altamente exploratória, tem uma taxa de sucesso menor do que a v1 e é adequada para pesquisas abertas.
Problemas de memóriaSe for solicitado "CUDA Out of Memory", altere o modelo pequeno no arquivo JSON.

Essas etapas lhe proporcionam uma experiência completa dos recursos de automação de pesquisa do AI-Scientist-v2.

cenário do aplicativo

pesquisa acadêmica
Os pesquisadores o utilizam para validar novos algoritmos, gerar os primeiros rascunhos de artigos e economizar tempo.
Aprendizagem educacional
Os alunos o utilizam para simular pesquisas científicas, gerar relatórios e aprender sobre projetos experimentais.
inovação tecnológica
Os desenvolvedores o utilizam para testar novas ideias e gerar rapidamente protótipos de código.

QA

Quais são os modelos suportados?
Suporte para Claude 3.5 Sonnet, GPT-4o, o1-preview, etc., consulte llm.py Documentação.
Quanto custou o experimento?
Com o Claude 3.5, são cerca de US$ 15 a US$ 20 por sessão, mais US$ 5 para escrever.
O que devo fazer se não conseguir gerar uma tese?
A taxa de sucesso varia de acordo com o modelo e a complexidade da ideia, e os parâmetros podem ser ajustados ou testados novamente com um modelo diferente.
Como faço para adicionar uma nova direção de pesquisa?
existir ai_scientist/ideas/ Adicione um novo arquivo JSON no diretório e modifique-o com referência ao exemplo.