AI-Scientist-v2：自律的な科学研究と論文執筆

1.3K 00

はじめに

AI-Scientist-v2は、日本のサカナアイによって開発された知的システムであり、科学研究を最初から最後まで機械によって自動化することを目的としている。2025年4月、このツールはGitHubでオープンソース化され、探索をよりスマートにするためにAgentic Tree Searchテクノロジーを追加した最初のバージョンでアップグレードされた。AI-Scientist-v2は人間のテンプレートに依存せず、幅広い機械学習ドメインに適用できるため、研究者や開発者に適している。

機能一覧

研究アイデアのプレゼンテーション入力された方向性に基づいて、実現可能な研究アイデアを自動的に生成します。
実験的コードを書く実験の実行に必要なコードを生成し、チューニングと最適化をサポートします。
実験と分析の実施自動的にコードを実行し、データを収集し、チャートを生成します。
科学論文の執筆実験結果に基づき、整った形式の論文を出力する。
インテリジェント・パス最適化エージェンティックツリー検索で最適なリサーチオプションを探します。
文献検索サポートSemantic Scholar APIにアクセスし、新規性のチェックや引用の追加を行うことができます。
オープンソース全コードが提供され、ユーザーは自由に修正、拡張することができる。

ヘルプの使用

AI-Scientist-v2はある程度の専門知識を必要としますが、設定すれば科学研究を劇的に簡素化することができます。以下は、ユーザーがすぐに使い始められるようにするための詳細な手順である。

設置プロセス

環境を整える
- Linuxと、CUDAとPyTorchをサポートするNVIDIA GPUが必要です。
- Python 3.11の環境を作る：
```
conda create -n ai_scientist python=3.11
conda activate ai_scientist
```
- PyTorchとCUDAをインストールする：
```
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
```

依存関係のインストール

ダウンロードコード

git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2

追加ツールをインストールします：

conda install anaconda::poppler  # 处理 PDF
conda install conda-forge::chktex  # 检查论文格式
pip install -r requirements.txt

APIの設定
- ビッグモデルAPIキー（例：OpenAI）を設定します：
```
export OPENAI_API_KEY='你的密钥'
```
- を使用する場合クロードモデルを追加サポートする：
```
pip install anthropic[bedrock]
```
  AWSのキーとリージョンを設定する：
```
export AWS_ACCESS_KEY_ID='你的ID'
export AWS_SECRET_ACCESS_KEY='你的密钥'
export AWS_REGION_NAME='us-west-2'
```
- Semantic Scholar APIを設定する：
```
export S2_API_KEY='你的密钥'
```
テスト環境
- GPUが使用可能かどうかを確認する：
```
python -c "import torch; print(torch.cuda.is_available())"
```
- 輸出 True インストールに成功したことを示す。

主な機能の使い方

1.研究アイデアの創出

コード・ディレクトリに移動して実行する：

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"

システムは研究のタイトルと説明を含むJSONファイルを生成する。

2.実験の実行

アイデアが生成された後、システムは実験コードを作成する（例えば、次のように）。 experiment.py).
実験を行う：

python experiment.py

結果は experiments フォルダーにデータとグラフを含むログを保存する。

3.論文の執筆

実験が完了したら、論文を作成する：

python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"

LaTeXファイルを出力します。 experiments/timestamp_ideaname/latex フォルダに保存してください。LaTeXエディタでコンパイルしてご覧ください。

4.エージェントツリー探索の使用

これは、スタディパスを最適化するv2の中核機能である。
実行時にパラメータを追加する：

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search

生成 unified_tree_viz.htmlブラウザがあれば、それを開いて検索プロセスを見ることができる。

5.構成ツリーの検索パラメーター

コンパイラ bfts_config.yaml ドキュメンテーション
num_workers並列処理のノード数、例えば3。
steps探索するノードの最大数。
num_drafts最初の研究の方向性の数。
max_debug_depthデバッグの試行回数。

ほら

安全性このコードはAIによって書かれたプログラムを実行し、危険なパッケージを呼び出したり、ネットワークに接続されたりする可能性があり、Dockerでの実行が推奨されている。
(製造原価実験1回につき約$15-$20、論文執筆料$5。
成功率v2は非常に探索的で、v1よりも成功率が低く、オープンな研究に適している。
記憶障害CUDA Out of Memory "と表示されたら、JSONファイルの小さなモデルを変更する。

これらのステップにより、AI-Scientist-v2の研究自動化機能を完全に体験することができます。

アプリケーションシナリオ

学術研究
研究者は、新しいアルゴリズムの検証、論文の初稿の作成、時間の節約などに利用している。
教育的学習
生徒たちはこのソフトを使って、科学研究のシミュレーションを行い、レポートを作成し、実験計画について学ぶ。
技術革新
開発者は、新しいアイデアをテストしたり、コードのプロトタイプを素早く生成したりするのに使う。

品質保証

対応機種は？
クロード3.5ソネット、GPT-4o、o1-プレビューなどをサポート。 llm.py ドキュメンテーション
実験にはいくらかかったのですか？
クロード3.5だと1回15ドルから20ドルくらいで、ライティングに5ドルかかる。
論文作成に失敗した場合はどうすればいいですか？
成功率はモデルやアイデアの複雑さによって異なり、パラメータを調整したり、別のモデルで再試行することもできる。
新しい研究方針を追加するには？
ある ai_scientist/ideas/ ディレクトリに新しいJSONファイルを追加し、サンプルを参照して修正する。