AI-Scientist-v2: Автономные научные исследования и написание статей

Последние ресурсы по искусственному интеллектуОпубликовано 11 месяцев назад Круг обмена ИИ

76.5K 00

Общее введение

AI-Scientist-v2 - это интеллектуальная система, разработанная японской компанией SakanaAI, цель которой - автоматизировать научные исследования от начала до конца с помощью машин. Она может придумывать идеи для исследований, разрабатывать эксперименты, выполнять код, анализировать данные и, наконец, писать научные статьи. В апреле 2025 года инструмент был открыт на GitHub и обновлен до первой версии, в которую была добавлена технология Agentic Tree Search, чтобы сделать исследования более интеллектуальными. Первая статья, написанная полностью искусственным интеллектом, прошла рецензирование на семинаре ICLR 2025. AI-Scientist-v2 не зависит от человеческих шаблонов и применим к широкому спектру областей машинного обучения, что делает его подходящим для исследователей и разработчиков.

Список функций

Презентация исследовательских идей: Автоматическое генерирование осуществимых исследовательских идей на основе заданных направлений.
Написание экспериментального кода: Создание кода, необходимого для проведения экспериментов, поддержка настройки и оптимизации.
Проведение экспериментов и анализов: Автоматическое выполнение кода, сбор данных и построение графиков.
Написание научных статей: Выпустите хорошо оформленный документ, основанный на результатах эксперимента.
Интеллектуальная оптимизация пути: Изучите лучшие варианты исследований с помощью Agentic Tree Search.
Поддержка поиска литературы: Дополнительный доступ к API Semantic Scholar для проверки новизны и добавления цитат.
открытый исходный код: Полный код предоставляется, и пользователи могут свободно изменять и расширять его.

Использование помощи

AI-Scientist-v2 требует определенных технических знаний, но при настройке он может значительно упростить научные исследования. Ниже приведены подробные шаги, которые помогут пользователям быстро приступить к работе.

Процесс установки

Подготовка среды
- Требуется Linux и графический процессор NVIDIA с поддержкой CUDA и PyTorch.
- Создайте среду Python 3.11:
```
conda create -n ai_scientist python=3.11
conda activate ai_scientist
```
- Установите PyTorch и CUDA:
```
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
```

Установка зависимостей

Код для скачивания:

git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2

Установите дополнительные инструменты:

conda install anaconda::poppler  # 处理 PDF
conda install conda-forge::chktex  # 检查论文格式
pip install -r requirements.txt

Настройка API
- Установите ключ API Big Model (например, OpenAI):
```
export OPENAI_API_KEY='你的密钥'
```
- Если вы используете Клод модель, устанавливая дополнительную опору:
```
pip install anthropic[bedrock]
```
  Настройте ключи и регионы AWS:
```
export AWS_ACCESS_KEY_ID='你的ID'
export AWS_SECRET_ACCESS_KEY='你的密钥'
export AWS_REGION_NAME='us-west-2'
```
- Опционально настройте API Semantic Scholar:
```
export S2_API_KEY='你的密钥'
```
тестовая среда
- Проверьте, доступен ли графический процессор:
```
python -c "import torch; print(torch.cuda.is_available())"
```
- экспорт True Указывает на успешную установку.

Как использовать основные функции

1. Генерирование идей для исследований

Перейдите в каталог с кодом и запустите его:

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"

Система генерирует JSON-файл, содержащий название и описание исследования.

2. Проведение экспериментов

После того как идея сгенерирована, система создает экспериментальный код (например. experiment.py).
Провести эксперименты:

python experiment.py

Результаты сохраняются в experiments папку с журналом, включая данные и графики.

3. Написание статей

После завершения эксперимента подготовьте статью:

python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"

Выводит файлы LaTeX, которые хранятся в файле experiments/timestamp_ideaname/latex папка. Чтобы просмотреть его, скомпилируйте в редакторе LaTeX.

4. Использование агентурного древовидного поиска

Это основная функция v2, которая оптимизирует пути обучения.
Добавляйте параметры во время выполнения:

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search

создание unified_tree_viz.htmlЕсли у вас есть браузер, вы можете открыть его, чтобы посмотреть процесс поиска.

5. Параметры поиска в дереве конфигурации

компилятор bfts_config.yaml Документация:
num_workers: Количество узлов для параллельной обработки, например, 3.
steps: Максимальное количество узлов для исследования, например, 21.
num_drafts: Количество первоначальных направлений исследований.
max_debug_depth: Количество попыток отладки.

предостережение

безопасность: Код выполняет программы, написанные искусственным интеллектом, может вызывать опасные пакеты или работать в сети, и его рекомендуется запускать с помощью Docker.
(производство, изготовление и т.д.) затратыПриблизительно $15-20 за эксперимент, плюс $5 за написание диссертации.
процент успеха: v2 носит исследовательский характер, имеет более низкий процент успеха, чем v1, и подходит для открытых исследований.
Проблемы с памятью: Если появится сообщение "CUDA Out of Memory", измените маленькую модель в файле JSON.

Эти шаги позволят вам получить полное представление о возможностях автоматизации исследований в AI-Scientist-v2.

сценарий применения

научные исследования
Исследователи используют его для проверки новых алгоритмов, создания первых черновиков статей и экономии времени.
Образовательное обучение
С его помощью студенты моделируют научные исследования, готовят отчеты и изучают экспериментальный дизайн.
технологическая инновация
Разработчики используют его для тестирования новых идей и быстрой генерации прототипов кода.

QA

Какие модели поддерживаются?
Поддержка Claude 3.5 Sonnet, GPT-4o, o1-preview и т.д., см. llm.py Документация.
Сколько стоил эксперимент?
С Claude 3.5 это примерно 15-20 долларов за сессию, плюс 5 долларов за написание.
Что делать, если не удается создать диссертацию?
Процент успеха зависит от модели и сложности идеи, а параметры можно скорректировать или повторить попытку с другой моделью.
Как добавить новое направление исследований?
существовать ai_scientist/ideas/ Добавьте новый JSON-файл в каталог и измените его, ссылаясь на пример.

Последние ресурсы по искусственному интеллекту # Создание отчета об углубленном исследовании # Диссертация