DeepResearcher: управляемый ИИ на основе обучения с подкреплением для изучения сложных проблем
Общее введение
DeepResearcher - это проект с открытым исходным кодом, разработанный командой GAIR-NLP в Шанхайском университете Цзяо Тун. Это интеллектуальный исследовательский инструмент, основанный на больших языковых моделях (LLM), обученных в реальной сетевой среде с помощью обучения с подкреплением (RL). Цель проекта - помочь пользователям эффективно выполнять сложные исследовательские задачи. Он автоматически ищет информацию, проверяет точность данных и генерирует подробные результаты. DeepResearcher поддерживает 7B параметрических моделей и был открыт на Hugging Face. Код доступен на GitHub и подходит для исследователей, студентов и энтузиастов технологий.


Список функций
- Исследование автоматизации: При вводе вопроса автоматически выполняется поиск в Интернете и сопоставляется соответствующая информация.
- кросс-источниковая аутентификация: Проверка данных из нескольких источников (например, Google, Bing) для обеспечения достоверности результатов.
- Самостоятельная корректировка: Самооценка на основе результатов поиска и переориентация исследований для повышения точности.
- Разработка программы исследований: Автоматическое генерирование шагов исследования при решении сложных задач.
- Будьте честны.: Ограничения указываются прямо, когда невозможно найти однозначный ответ.
- Поддержка моделей с открытым исходным кодом: Предоставляется параметрическая модель 7B, которая может быть загружена и настроена пользователем.
Использование помощи
Установка и использование DeepResearcher требует определенных технических знаний, но в официальной документации даны четкие инструкции. Ниже приведены подробные шаги, которые помогут пользователям быстро приступить к работе.
Процесс установки
- Репозиторий клонированного кода
Выполните следующую команду в терминале, чтобы загрузить проект локально:
git clone https://github.com/GAIR-NLP/DeepResearcher.git
Перейдите в каталог проектов:
cd DeepResearcher
- Создание виртуальной среды
Используйте conda, чтобы создать отдельное окружение Python и избежать конфликтов зависимостей:
conda create -n deepresearcher python=3.10
Активируйте окружающую среду:
conda activate deepresearcher
- Установка основных зависимостей
Установите PyTorch и другие необходимые библиотеки, выполнив последовательно следующие команды из корневого каталога проекта:
pip3 install torch==2.4.0 --index-url https://download.pytorch.org/whl/cu124
pip3 install flash-attn --no-build-isolation
cd verl
pip3 install -e .
cd ../
pip3 install -r requirements.txt
Эти шаги обеспечивают наличие базовой среды, необходимой для работы модели.
- Проверка установки
Введите следующую команду, чтобы проверить, правильно ли установлен PyTorch:
python -c "import torch; print(torch.__version__)"
Если отображается номер версии (например, 2.4.0), установка прошла успешно.
Конфигурация и ввод в эксплуатацию
DeepResearcher использует фреймворк Ray для обучения и вывода, а также требует настройки службы поиска. Вот как это сделать.
Запуск службы Ray
- Установка рейтинга узлов
Введите в терминале следующую команду, чтобы задать номер узла (это необходимо, даже если машина одна):
export PET_NODE_RANK=0
ray start --head
- Настройка служб поиска
- показать (билет)
./scrl/handler/config.yaml
Если вы хотите изменить API-ключ поиска, вы можете сделать это, нажав на кнопку "Поиск":- Использование Serper API: заполните
serper_api_key
. - Используйте Azure Bing: заполните
azure_bing_search_subscription_key
и установитьsearch_engine
для Бинга.
- Использование Serper API: заполните
- компилятор
./scrl/handler/server_handler.py
Если вы хотите добавить ключ API Qwen-Plus, добавьте ключ API Qwen-Plus:client = OpenAI( api_key="sk-xxx", base_url="xxxx" )
- Запуск сервисного процессора
Запускается в терминале:
python ./scrl/handler/server_handler.py
После запуска сервиса запишите адрес сервиса и обновите его. ./scrl/handler/config.yaml
попал в точку server_url_list
.
- Запуск главного процессора
Запускается на обучающем хосте:
python ./scrl/handler/handler.py
Модели обучения
- Выполнение учебных сценариев
Запустите его в корневом каталоге проекта:
bash train_grpo.sh
Процесс обучения оптимизирует модель на основе обучения с подкреплением и требует терпения.
Использование и обоснование
- Получение результатов исследований
Запустите сценарий оценки:
bash evaluate.sh
Выходной файл сохраняется в ./outputs/{project_name}/{experiment_name}/rollout/rollout_step_0.json
.
- Посмотреть результаты
Переименуйте выходной файл в{experiment_name}_result.json
Перейти к./evaluate/
и запустите его:
python ./evaluate/cacluate_metrics.py {experiment_name}
Оценка сохраняется в ./evaluate/{experiment_name}_score.json
.
Функциональное управление
- Автоматизированное исследование и проверка из разных источников
После того как пользователь вводит вопрос, DeepResearcher собирает данные из настроенных поисковых систем (например, Google, Bing) и проводит перекрестную проверку результатов. Лог-файлы./outputs/research_log.txt
Процесс валидации будет документироваться. - Самостоятельная корректировка
Если первые результаты окажутся неудовлетворительными, система автоматически скорректирует ключевые слова или стратегию поиска. Например, если ввести "искусственный интеллект в здравоохранении", он может измениться на "новейшие медицинские технологии искусственного интеллекта", и результаты будут более точными. - Будьте честны.
Если на вопрос нет четкого ответа, вместо предположения он возвращает что-то вроде "Недостаточно информации для однозначного вывода".
предостережение
- Убедитесь, что ваше интернет-соединение стабильно и что функция поиска использует данные в режиме реального времени.
- Обучение и выводы требуют больших вычислительных ресурсов, поэтому рекомендуется использовать графические процессоры.
- Проект все еще находится в разработке, поэтому мы рекомендуем следить за обновлениями на GitHub.
Выполнив эти действия, пользователи смогут легко установить и использовать DeepResearcher, чтобы испытать его интеллектуальные исследовательские возможности.
сценарий применения
- научные исследования
Исследователи могут использовать его для поиска бумажных материалов, проверки источников и создания первых черновиков исследовательских отчетов. - Обучение студентов
Студенты могут использовать его для систематизации знаний по курсу и быстрого выполнения заданий или исследований по проекту. - развитие технологий
Разработчики могут использовать его для изучения технологических тенденций, получения обновлений и решений в отрасли.
QA
- Поддерживает ли DeepResearcher китайский язык?
Поддержка. Пользователи могут вводить вопросы на китайском языке, и программа будет отдавать предпочтение поиску китайских ресурсов, а также может обрабатывать данные на английском языке. - Нужен графический процессор?
Не обязательно, но GPU может ускорить обучение и выводы. CPU тоже может это делать, просто медленнее. - Как получить последнюю версию?
Запустите в каталоге проектаgit pull
, затем переустановите зависимости для обновления.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...