AI-Scientist-v2: Автономные научные исследования и написание статей
Общее введение
AI-Scientist-v2 - это интеллектуальная система, разработанная японской компанией SakanaAI, цель которой - автоматизировать научные исследования от начала до конца с помощью машин. Она может придумывать идеи для исследований, разрабатывать эксперименты, выполнять код, анализировать данные и, наконец, писать научные статьи. В апреле 2025 года инструмент был открыт на GitHub и обновлен до первой версии, в которую была добавлена технология Agentic Tree Search, чтобы сделать исследования более интеллектуальными. Первая статья, написанная полностью искусственным интеллектом, прошла рецензирование на семинаре ICLR 2025. AI-Scientist-v2 не зависит от человеческих шаблонов и применим к широкому спектру областей машинного обучения, что делает его подходящим для исследователей и разработчиков.

Список функций
- Презентация исследовательских идей: Автоматическое генерирование осуществимых исследовательских идей на основе заданных направлений.
- Написание экспериментального кода: Создание кода, необходимого для проведения экспериментов, поддержка настройки и оптимизации.
- Проведение экспериментов и анализов: Автоматическое выполнение кода, сбор данных и построение графиков.
- Написание научных статей: Выпустите хорошо оформленный документ, основанный на результатах эксперимента.
- Интеллектуальная оптимизация пути: Изучите лучшие варианты исследований с помощью Agentic Tree Search.
- Поддержка поиска литературы: Дополнительный доступ к API Semantic Scholar для проверки новизны и добавления цитат.
- открытый исходный код: Полный код предоставляется, и пользователи могут свободно изменять и расширять его.
Использование помощи
AI-Scientist-v2 требует определенных технических знаний, но при настройке он может значительно упростить научные исследования. Ниже приведены подробные шаги, которые помогут пользователям быстро приступить к работе.
Процесс установки
- Подготовка среды
- Требуется Linux и графический процессор NVIDIA с поддержкой CUDA и PyTorch.
- Создайте среду Python 3.11:
conda create -n ai_scientist python=3.11 conda activate ai_scientist
- Установите PyTorch и CUDA:
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
- Установка зависимостей
- Код для скачивания:
git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2
- Установите дополнительные инструменты:
conda install anaconda::poppler # 处理 PDF conda install conda-forge::chktex # 检查论文格式 pip install -r requirements.txt
- Код для скачивания:
- Настройка API
- Установите ключ API Big Model (например, OpenAI):
export OPENAI_API_KEY='你的密钥'
- Если вы используете Клод модель, устанавливая дополнительную опору:
pip install anthropic[bedrock]
Настройте ключи и регионы AWS:
export AWS_ACCESS_KEY_ID='你的ID' export AWS_SECRET_ACCESS_KEY='你的密钥' export AWS_REGION_NAME='us-west-2'
- Опционально настройте API Semantic Scholar:
export S2_API_KEY='你的密钥'
- Установите ключ API Big Model (например, OpenAI):
- тестовая среда
- Проверьте, доступен ли графический процессор:
python -c "import torch; print(torch.cuda.is_available())"
- экспорт
True
Указывает на успешную установку.
- Проверьте, доступен ли графический процессор:
Как использовать основные функции
1. Генерирование идей для исследований
- Перейдите в каталог с кодом и запустите его:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
- Система генерирует JSON-файл, содержащий название и описание исследования.
2. Проведение экспериментов
- После того как идея сгенерирована, система создает экспериментальный код (например.
experiment.py
). - Провести эксперименты:
python experiment.py
- Результаты сохраняются в
experiments
папку с журналом, включая данные и графики.
3. Написание статей
- После завершения эксперимента подготовьте статью:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
- Выводит файлы LaTeX, которые хранятся в файле
experiments/timestamp_ideaname/latex
папка. Чтобы просмотреть его, скомпилируйте в редакторе LaTeX.
4. Использование агентурного древовидного поиска
- Это основная функция v2, которая оптимизирует пути обучения.
- Добавляйте параметры во время выполнения:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
- создание
unified_tree_viz.html
Если у вас есть браузер, вы можете открыть его, чтобы посмотреть процесс поиска.
5. Параметры поиска в дереве конфигурации
- компилятор
bfts_config.yaml
Документация: num_workers
: Количество узлов для параллельной обработки, например, 3.steps
: Максимальное количество узлов для исследования, например, 21.num_drafts
: Количество первоначальных направлений исследований.max_debug_depth
: Количество попыток отладки.
предостережение
- безопасность: Код выполняет программы, написанные искусственным интеллектом, может вызывать опасные пакеты или работать в сети, и его рекомендуется запускать с помощью Docker.
- (производство, изготовление и т.д.) затратыПриблизительно $15-20 за эксперимент, плюс $5 за написание диссертации.
- процент успеха: v2 носит исследовательский характер, имеет более низкий процент успеха, чем v1, и подходит для открытых исследований.
- Проблемы с памятью: Если появится сообщение "CUDA Out of Memory", измените маленькую модель в файле JSON.
Эти шаги позволят вам получить полное представление о возможностях автоматизации исследований в AI-Scientist-v2.
сценарий применения
- научные исследования
Исследователи используют его для проверки новых алгоритмов, создания первых черновиков статей и экономии времени. - Образовательное обучение
С его помощью студенты моделируют научные исследования, готовят отчеты и изучают экспериментальный дизайн. - технологическая инновация
Разработчики используют его для тестирования новых идей и быстрой генерации прототипов кода.
QA
- Какие модели поддерживаются?
Поддержка Claude 3.5 Sonnet, GPT-4o, o1-preview и т.д., см.llm.py
Документация. - Сколько стоил эксперимент?
С Claude 3.5 это примерно 15-20 долларов за сессию, плюс 5 долларов за написание. - Что делать, если не удается создать диссертацию?
Процент успеха зависит от модели и сложности идеи, а параметры можно скорректировать или повторить попытку с другой моделью. - Как добавить новое направление исследований?
существоватьai_scientist/ideas/
Добавьте новый JSON-файл в каталог и измените его, ссылаясь на пример.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...