综合介绍
AI-Scientist-v2 是由日本 SakanaAI 公司开发的智能系统,旨在让机器从头到尾自动完成科学研究。它能提出研究想法、设计实验、运行代码、分析数据,最后写出科学论文。2025 年 4 月,这个工具在 GitHub 上开源,升级了第一版,加入了 Agentic Tree Search 技术,让探索更智能。它生成的第一篇完全由 AI 撰写的论文已通过 ICLR 2025 研讨会的同行评审。AI-Scientist-v2 不依赖人类模板,适用于多种机器学习领域,适合研究人员和开发者使用。
功能列表
- 提出研究想法:根据输入方向,自动生成可行的科研点子。
- 编写实验代码:生成运行实验所需的代码,支持调整和优化。
- 执行实验与分析:自动运行代码,收集数据,生成图表。
- 撰写科学论文:根据实验结果,输出格式规范的论文。
- 智能路径优化:通过 Agentic Tree Search,探索最佳研究方案。
- 文献搜索支持:可选接入 Semantic Scholar API,检查新颖性并添加引用。
- 开源代码:提供完整代码,用户可自由修改和扩展。
使用帮助
AI-Scientist-v2 需要一定的技术基础,但配置好后能大幅简化科研工作。以下是详细步骤,帮助用户快速上手。
安装流程
- 准备环境
- 需要 Linux 系统和 NVIDIA GPU,支持 CUDA 和 PyTorch。
- 创建 Python 3.11 环境:
conda create -n ai_scientist python=3.11 conda activate ai_scientist
- 安装 PyTorch 和 CUDA:
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
- 安装依赖
- 下载代码:
git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2
- 安装其他工具:
conda install anaconda::poppler # 处理 PDF conda install conda-forge::chktex # 检查论文格式 pip install -r requirements.txt
- 下载代码:
- 配置 API
- 设置大模型 API 密钥(如 OpenAI):
export OPENAI_API_KEY='你的密钥'
- 如果用 Claude 模型,安装额外支持:
pip install anthropic[bedrock]
设置 AWS 密钥和区域:
export AWS_ACCESS_KEY_ID='你的ID' export AWS_SECRET_ACCESS_KEY='你的密钥' export AWS_REGION_NAME='us-west-2'
- 可选配置 Semantic Scholar API:
export S2_API_KEY='你的密钥'
- 设置大模型 API 密钥(如 OpenAI):
- 测试环境
- 检查 GPU 是否可用:
python -c "import torch; print(torch.cuda.is_available())"
- 输出
True
表示安装成功。
- 检查 GPU 是否可用:
如何使用主要功能
1. 生成研究想法
- 进入代码目录,运行:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
- 系统会生成一个 JSON 文件,包含研究标题和描述。
2. 运行实验
- 想法生成后,系统会创建实验代码(如
experiment.py
)。 - 执行实验:
python experiment.py
- 结果保存在
experiments
文件夹下的日志中,包括数据和图表。
3. 撰写论文
- 实验完成后,生成论文:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
- 输出 LaTeX 文件,存放在
experiments/timestamp_ideaname/latex
文件夹。用 LaTeX 编辑器编译即可查看。
4. 使用 Agentic Tree Search
- 这是 v2 的核心功能,能优化研究路径。
- 运行时加入参数:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
- 生成
unified_tree_viz.html
,用浏览器打开可查看搜索过程。
5. 配置树搜索参数
- 编辑
bfts_config.yaml
文件: num_workers
:并行处理的节点数,如 3。steps
:最大探索节点数,如 21。num_drafts
:初始研究方向数量。max_debug_depth
:调试尝试次数。
注意事项
- 安全性:代码会执行 AI 写的程序,可能调用危险包或联网,建议用 Docker 运行。
- 成本:每次实验约 15-20 美元,论文撰写加 5 美元。
- 成功率:v2 探索性强,成功率低于 v1,适合开放性研究。
- 内存问题:若提示 “CUDA Out of Memory”,在 JSON 文件中换小模型。
这些步骤能让你完整体验 AI-Scientist-v2 的科研自动化功能。
应用场景
- 学术研究
研究人员用它验证新算法,生成论文初稿,节省时间。 - 教育学习
学生用它模拟科研,生成报告,学习实验设计。 - 技术创新
开发者用它测试新想法,快速生成代码原型。
QA
- 支持哪些模型?
支持 Claude 3.5 Sonnet、GPT-4o、o1-preview 等,见llm.py
文件。 - 实验成本多少?
用 Claude 3.5 每次约 15-20 美元,写作加 5 美元。 - 论文生成失败怎么办?
成功率因模型和想法复杂度而异,可调整参数或换模型重试。 - 如何添加新研究方向?
在ai_scientist/ideas/
目录下新增 JSON 文件,参考示例修改。