AI个人学习
和实操指南
豆包Marscode1

AI-Scientist-v2:自主完成科研研究与论文撰写

综合介绍

AI-Scientist-v2 是由日本 SakanaAI 公司开发的智能系统,旨在让机器从头到尾自动完成科学研究。它能提出研究想法、设计实验、运行代码、分析数据,最后写出科学论文。2025 年 4 月,这个工具在 GitHub 上开源,升级了第一版,加入了 Agentic Tree Search 技术,让探索更智能。它生成的第一篇完全由 AI 撰写的论文已通过 ICLR 2025 研讨会的同行评审。AI-Scientist-v2 不依赖人类模板,适用于多种机器学习领域,适合研究人员和开发者使用。

AI-Scientist-v2:自主完成科研研究与论文撰写-1


 

功能列表

  • 提出研究想法:根据输入方向,自动生成可行的科研点子。
  • 编写实验代码:生成运行实验所需的代码,支持调整和优化。
  • 执行实验与分析:自动运行代码,收集数据,生成图表。
  • 撰写科学论文:根据实验结果,输出格式规范的论文。
  • 智能路径优化:通过 Agentic Tree Search,探索最佳研究方案。
  • 文献搜索支持:可选接入 Semantic Scholar API,检查新颖性并添加引用。
  • 开源代码:提供完整代码,用户可自由修改和扩展。

 

使用帮助

AI-Scientist-v2 需要一定的技术基础,但配置好后能大幅简化科研工作。以下是详细步骤,帮助用户快速上手。

安装流程

  1. 准备环境
    • 需要 Linux 系统和 NVIDIA GPU,支持 CUDA 和 PyTorch。
    • 创建 Python 3.11 环境:
      conda create -n ai_scientist python=3.11
      conda activate ai_scientist
      
    • 安装 PyTorch 和 CUDA:
      conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
      
  2. 安装依赖
    • 下载代码:
      git clone https://github.com/SakanaAI/AI-Scientist-v2.git
      cd AI-Scientist-v2
      
    • 安装其他工具:
      conda install anaconda::poppler  # 处理 PDF
      conda install conda-forge::chktex  # 检查论文格式
      pip install -r requirements.txt
      
  3. 配置 API
    • 设置大模型 API 密钥(如 OpenAI):
      export OPENAI_API_KEY='你的密钥'
      
    • 如果用 Claude 模型,安装额外支持:
      pip install anthropic[bedrock]
      

      设置 AWS 密钥和区域:

      export AWS_ACCESS_KEY_ID='你的ID'
      export AWS_SECRET_ACCESS_KEY='你的密钥'
      export AWS_REGION_NAME='us-west-2'
      
    • 可选配置 Semantic Scholar API:
      export S2_API_KEY='你的密钥'
      
  4. 测试环境
    • 检查 GPU 是否可用:
      python -c "import torch; print(torch.cuda.is_available())"
      
    • 输出 True 表示安装成功。

如何使用主要功能

1. 生成研究想法

  • 进入代码目录,运行:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
  • 系统会生成一个 JSON 文件,包含研究标题和描述。

2. 运行实验

  • 想法生成后,系统会创建实验代码(如 experiment.py)。
  • 执行实验:
python experiment.py
  • 结果保存在 experiments 文件夹下的日志中,包括数据和图表。

3. 撰写论文

  • 实验完成后,生成论文:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
  • 输出 LaTeX 文件,存放在 experiments/timestamp_ideaname/latex 文件夹。用 LaTeX 编辑器编译即可查看。

4. 使用 Agentic Tree Search

  • 这是 v2 的核心功能,能优化研究路径。
  • 运行时加入参数:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
  • 生成 unified_tree_viz.html,用浏览器打开可查看搜索过程。

5. 配置树搜索参数

  • 编辑 bfts_config.yaml 文件:
  • num_workers:并行处理的节点数,如 3。
  • steps:最大探索节点数,如 21。
  • num_drafts:初始研究方向数量。
  • max_debug_depth:调试尝试次数。

注意事项

  • 安全性:代码会执行 AI 写的程序,可能调用危险包或联网,建议用 Docker 运行。
  • 成本:每次实验约 15-20 美元,论文撰写加 5 美元。
  • 成功率:v2 探索性强,成功率低于 v1,适合开放性研究。
  • 内存问题:若提示 “CUDA Out of Memory”,在 JSON 文件中换小模型。

这些步骤能让你完整体验 AI-Scientist-v2 的科研自动化功能。

 

应用场景

  1. 学术研究
    研究人员用它验证新算法,生成论文初稿,节省时间。
  2. 教育学习
    学生用它模拟科研,生成报告,学习实验设计。
  3. 技术创新
    开发者用它测试新想法,快速生成代码原型。

 

QA

  1. 支持哪些模型?
    支持 Claude 3.5 Sonnet、GPT-4o、o1-preview 等,见 llm.py 文件。
  2. 实验成本多少?
    用 Claude 3.5 每次约 15-20 美元,写作加 5 美元。
  3. 论文生成失败怎么办?
    成功率因模型和想法复杂度而异,可调整参数或换模型重试。
  4. 如何添加新研究方向?
    在 ai_scientist/ideas/ 目录下新增 JSON 文件,参考示例修改。
未经允许不得转载:首席AI分享圈 » AI-Scientist-v2:自主完成科研研究与论文撰写
zh_CN简体中文