AI-Scientist-v2: Автономные научные исследования и написание статей

Общее введение

AI-Scientist-v2 - это интеллектуальная система, разработанная японской компанией SakanaAI, цель которой - автоматизировать научные исследования от начала до конца с помощью машин. Она может придумывать идеи для исследований, разрабатывать эксперименты, выполнять код, анализировать данные и, наконец, писать научные статьи. В апреле 2025 года инструмент был открыт на GitHub и обновлен до первой версии, в которую была добавлена технология Agentic Tree Search, чтобы сделать исследования более интеллектуальными. Первая статья, написанная полностью искусственным интеллектом, прошла рецензирование на семинаре ICLR 2025. AI-Scientist-v2 не зависит от человеческих шаблонов и применим к широкому спектру областей машинного обучения, что делает его подходящим для исследователей и разработчиков.

AI-Scientist-v2:自主完成科研研究与论文撰写

 

Список функций

  • Презентация исследовательских идей: Автоматическое генерирование осуществимых исследовательских идей на основе заданных направлений.
  • Написание экспериментального кода: Создание кода, необходимого для проведения экспериментов, поддержка настройки и оптимизации.
  • Проведение экспериментов и анализов: Автоматическое выполнение кода, сбор данных и построение графиков.
  • Написание научных статей: Выпустите хорошо оформленный документ, основанный на результатах эксперимента.
  • Интеллектуальная оптимизация пути: Изучите лучшие варианты исследований с помощью Agentic Tree Search.
  • Поддержка поиска литературы: Дополнительный доступ к API Semantic Scholar для проверки новизны и добавления цитат.
  • открытый исходный код: Полный код предоставляется, и пользователи могут свободно изменять и расширять его.

 

Использование помощи

AI-Scientist-v2 требует определенных технических знаний, но при настройке он может значительно упростить научные исследования. Ниже приведены подробные шаги, которые помогут пользователям быстро приступить к работе.

Процесс установки

  1. Подготовка среды
    • Требуется Linux и графический процессор NVIDIA с поддержкой CUDA и PyTorch.
    • Создайте среду Python 3.11:
      conda create -n ai_scientist python=3.11
      conda activate ai_scientist
      
    • Установите PyTorch и CUDA:
      conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
      
  2. Установка зависимостей
    • Код для скачивания:
      git clone https://github.com/SakanaAI/AI-Scientist-v2.git
      cd AI-Scientist-v2
      
    • Установите дополнительные инструменты:
      conda install anaconda::poppler  # 处理 PDF
      conda install conda-forge::chktex  # 检查论文格式
      pip install -r requirements.txt
      
  3. Настройка API
    • Установите ключ API Big Model (например, OpenAI):
      export OPENAI_API_KEY='你的密钥'
      
    • Если вы используете Клод модель, устанавливая дополнительную опору:
      pip install anthropic[bedrock]
      

      Настройте ключи и регионы AWS:

      export AWS_ACCESS_KEY_ID='你的ID'
      export AWS_SECRET_ACCESS_KEY='你的密钥'
      export AWS_REGION_NAME='us-west-2'
      
    • Опционально настройте API Semantic Scholar:
      export S2_API_KEY='你的密钥'
      
  4. тестовая среда
    • Проверьте, доступен ли графический процессор:
      python -c "import torch; print(torch.cuda.is_available())"
      
    • экспорт True Указывает на успешную установку.

Как использовать основные функции

1. Генерирование идей для исследований

  • Перейдите в каталог с кодом и запустите его:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
  • Система генерирует JSON-файл, содержащий название и описание исследования.

2. Проведение экспериментов

  • После того как идея сгенерирована, система создает экспериментальный код (например. experiment.py).
  • Провести эксперименты:
python experiment.py
  • Результаты сохраняются в experiments папку с журналом, включая данные и графики.

3. Написание статей

  • После завершения эксперимента подготовьте статью:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
  • Выводит файлы LaTeX, которые хранятся в файле experiments/timestamp_ideaname/latex папка. Чтобы просмотреть его, скомпилируйте в редакторе LaTeX.

4. Использование агентурного древовидного поиска

  • Это основная функция v2, которая оптимизирует пути обучения.
  • Добавляйте параметры во время выполнения:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
  • создание unified_tree_viz.htmlЕсли у вас есть браузер, вы можете открыть его, чтобы посмотреть процесс поиска.

5. Параметры поиска в дереве конфигурации

  • компилятор bfts_config.yaml Документация:
  • num_workers: Количество узлов для параллельной обработки, например, 3.
  • steps: Максимальное количество узлов для исследования, например, 21.
  • num_drafts: Количество первоначальных направлений исследований.
  • max_debug_depth: Количество попыток отладки.

предостережение

  • безопасность: Код выполняет программы, написанные искусственным интеллектом, может вызывать опасные пакеты или работать в сети, и его рекомендуется запускать с помощью Docker.
  • (производство, изготовление и т.д.) затратыПриблизительно $15-20 за эксперимент, плюс $5 за написание диссертации.
  • процент успеха: v2 носит исследовательский характер, имеет более низкий процент успеха, чем v1, и подходит для открытых исследований.
  • Проблемы с памятью: Если появится сообщение "CUDA Out of Memory", измените маленькую модель в файле JSON.

Эти шаги позволят вам получить полное представление о возможностях автоматизации исследований в AI-Scientist-v2.

 

сценарий применения

  1. научные исследования
    Исследователи используют его для проверки новых алгоритмов, создания первых черновиков статей и экономии времени.
  2. Образовательное обучение
    С его помощью студенты моделируют научные исследования, готовят отчеты и изучают экспериментальный дизайн.
  3. технологическая инновация
    Разработчики используют его для тестирования новых идей и быстрой генерации прототипов кода.

 

QA

  1. Какие модели поддерживаются?
    Поддержка Claude 3.5 Sonnet, GPT-4o, o1-preview и т.д., см. llm.py Документация.
  2. Сколько стоил эксперимент?
    С Claude 3.5 это примерно 15-20 долларов за сессию, плюс 5 долларов за написание.
  3. Что делать, если не удается создать диссертацию?
    Процент успеха зависит от модели и сложности идеи, а параметры можно скорректировать или повторить попытку с другой моделью.
  4. Как добавить новое направление исследований?
    существовать ai_scientist/ideas/ Добавьте новый JSON-файл в каталог и измените его, ссылаясь на пример.
© заявление об авторских правах

Похожие статьи

Leon:用语音交流的个人助理,创建自定义技能完成各类任务,保护隐私,离线运行

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...