Together Open Deep Research: генерация индексированных отчетов о глубоких исследованиях

Общее введение

Открытые глубокие исследования - это программа Вместе Инструмент для глубоких исследований, разработанный и открытый командой ИИ и размещенный на GitHub. Он генерирует подробные отчеты об исследованиях с помощью многоагентного рабочего процесса ИИ, который имитирует процесс исследования человеком. Пользователи просто вводят тему исследования, а инструмент автоматически планирует, ищет, оценивает информацию и пишет отчет с цитатами. Проект поддерживает Python 3.12+ и требует настройки API-ключей для использования внешних сервисов поиска и языкового моделирования. Он подходит для академических исследований, анализа рынка и других сценариев. Благодаря открытому исходному коду и расширению сообщества, каждый может получить код бесплатно и настроить его в соответствии со своими потребностями.

Together Open Deep Research:生成带索引的深度研究报告

 

Список функций

  • Подготовка комплексного исследования: Автоматически генерирует длинные исследовательские отчеты, содержащие цитаты, на основе введенных пользователем тем.
  • Многоступенчатый сбор информации: Обеспечение качества информации на этапах планирования, поиска и самоанализа.
  • проверка информации из нескольких источников: Поддержка веб-поиска через API, такие как Tavily, HuggingFace и т.д., с цитированием источников.
  • Гибкий архитектурный дизайн: Пользователи могут настраивать модели, инструменты поиска и структуры отчетов в соответствии с различными потребностями.
  • Поддержка мультимодального выводаДополнительный контент, такой как изображения на обложке, подкасты и т. д., может быть автоматически создан при создании отчетов.
  • Открытый исходный код и сообщество: Код полностью открыт, что позволяет пользователям изменять и расширять функциональность.

 

Использование помощи

Процесс установки

Чтобы использовать Open Deep Research, необходимо настроить среду выполнения локально или на сервере. Ниже приведены подробные шаги по установке:

  1. Проверка соблюдения экологических требований
    Убедитесь, что установлен Python 3.12 или более поздней версии. Рекомендуется использовать виртуальную среду, чтобы избежать конфликтов зависимостей. Вам также потребуется установить uv(чуть больше, чем pip (Более эффективный инструмент управления пакетами).

    curl -LsSf https://astral.sh/uv/install.sh | sh
    
  2. Репозиторий клонированного кода
    Клонируйте код проекта локально с GitHub:

    git clone https://github.com/togethercomputer/open_deep_research.git
    cd open_deep_research
    
  3. Создание и активация виртуальной среды
    пользоваться uv Создайте виртуальную среду и активируйте ее:

    uv venv --python=3.12
    source .venv/bin/activate
    
  4. Установка зависимостей
    Установите все пакеты Python, необходимые для вашего проекта:

    uv pip install -r pyproject.toml
    uv lock --check
    

    Если вам нужно запустить LangGraph оценка, могут быть установлены дополнительные зависимости:

    uv pip install -e ".[with-open-deep-research]"
    
  5. Настройка ключей API
    Проект использует внешние сервисы, такие как Together AI, Tavily и HuggingFace, для поиска и вывода языковой модели. Необходимо установить следующие переменные окружения:

    export TOGETHER_API_KEY=your_together_api_key
    export TAVILY_API_KEY=your_tavily_api_key
    export HUGGINGFACE_TOKEN=your_huggingface_token
    

    главнокомандующий (военный) your_together_api_key и т. д. заменяются реальным ключом API. Зарегистрировать аккаунт и получить ключ можно на официальном сайте поставщика услуг.

  6. Текущие проекты
    После завершения установки запустите основную программу, чтобы начать выполнение исследовательской задачи. Например, создайте отчет по теме "Этика искусственного интеллекта":

    python main.py --topic "人工智能伦理"
    

    Программа автоматически выполняет планирование, поиск и создание отчетов, сохраняя результаты в виде файла Markdown.

Основные функции

Основной особенностью Open Deep Research является автоматическое создание исследовательских отчетов. Ниже приводится подробная процедура:

  1. Укажите тему исследования
    Пользователь задает тему исследования в командной строке или в скрипте. Пример:

    python main.py --topic "气候变化的影响"
    

    Темы должны быть максимально понятными, чтобы инструмент мог генерировать целевые отчеты.

  2. этап планирования
    Сначала инструмент использует языковую модель (например. Клод или GPT) для создания контура отчета. Пользователь может принять контур по умолчанию или вручную создать собственную структуру. Например, пользовательская структура может быть следующей:

    {
    "title": "气候变化影响研究",
    "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"]
    }
    

    Сохраняется в виде файла JSON и указывается в командной строке:

    python main.py --topic "气候变化的影响" --structure custom_structure.json
    
  3. Поиск и проверка информации
    Инструмент передается через Tavily API выполняет веб-поиск, чтобы получить веб-контент, связанный с темой. При каждом поиске система анализирует себя, оценивает качество информации и задает последующие вопросы. Например, если поиск ведется по запросу "экологические последствия изменения климата", система может создать подвопросы, такие как "конкретные данные о повышении уровня моря". Результаты поиска автоматически дедублируются и из них извлекается ключевая информация.
  4. Формирование отчетов
    Система организует собранную информацию в отчет в формате Markdown, включающий заголовок, главу, введение, основную часть и ссылки. Отчет поддерживает вывод на нескольких языках, по умолчанию он генерируется на английском, но пользователь может настроить его на генерацию версий на китайском или других языках.
  5. Мультимодальные расширения
    Инструмент поддерживает создание изображений для обложки и аудиоподкаста для сопровождения отчета. Изображение создается с помощью модели генерации изображений, например DALL-E, а подкаст - с помощью сервиса преобразования текста в речь. Эти функции требуют дополнительной настройки API, например:

    export DALLE_API_KEY=your_dalle_api_key
    

    После создания изображения и аудиофайлы сохраняются в выходном каталоге.

Функциональное управление

  • Совместная работа нескольких агентов
    В Open Deep Research используется многоагентный рабочий процесс, который подразделяется на агент планирования, агент поиска и агент написания. Пользователи могут настраивать поведение агентов с помощью конфигурационных файлов, например, задавая глубину поиска:

    python main.py --topic "人工智能伦理" --max_search_depth 3
    

    Приведенная выше команда увеличивает количество итераций поиска до 3, чтобы получить более глубокую информацию.

  • Расширение сообщества
    Поскольку проект имеет открытый исходный код, пользователи могут пополнять репозиторий кода для добавления новых функций. Например, интегрировать новые поисковые API (такие как Google Custom Search) или поддерживать больше языковых моделей. После внесения изменений в код повторно запустите команду установки, чтобы она вступила в силу.

предостережение

  • Убедитесь в стабильности сетевых соединений, а также в том, что поиск и вывод моделей опираются на внешние API.
  • Ключи API необходимо хранить должным образом, чтобы избежать утечки.
  • Если вы столкнулись с конфликтом зависимостей, попробуйте обновить uv или запустите проект с помощью Docker.

 

сценарий применения

  1. научные исследования
    Студенты и исследователи могут использовать Open Deep Research для быстрого создания обзора литературы или отчета об исследованиях. Например, введите "последние достижения в области квантовых вычислений", и инструмент выполнит поиск в академических базах данных и веб-ресурсах, чтобы создать подробный отчет с цитатами.
  2. анализ рынка
    Бизнес-аналитики могут использовать этот инструмент для изучения тенденций развития отрасли. Например, введите "Electric Vehicle Market Forecast 2025", и инструмент соберет рыночные данные, новости и отчеты для создания структурированного аналитического документа.
  3. Образование и обучение
    Преподаватели могут подготовить учебные материалы для курса. Например, введите "Основы программирования на Python", и инструмент сгенерирует учебную программу с учебниками, примерами кода и ресурсами.
  4. создание контента
    Создатели контента могут быстро получить вдохновение или справочную информацию. Например, введите "будущее метавселенной", и инструмент сгенерирует отчет с технологическими тенденциями и социальными последствиями для написания текстов.

 

QA

  1. Какие языковые модели поддерживаются Open Deep Research?
    По умолчанию поддерживаются модели от Together AI, OpenAI и HuggingFace. Пользователи могут добавлять другие модели через файлы конфигурации, например DeepSeek Или Клод.
  2. Нужно ли платить, чтобы пользоваться им?
    Сам проект бесплатный, но зависимые API-сервисы (например, Tavily, Together AI) требуют оплаты за ключи. Пользователи могут выбирать между бесплатным альтернативным сервисом и локальной моделью.
  3. Как можно повысить качество отчетности?
    Увеличьте глубину поиска (--max_search_depth) или использовать более мощную языковую модель (например, GPT-4). Предоставление подробного описания предмета также может помочь в создании более точных отчетов.
  4. Можно ли использовать его в автономном режиме?
    В настоящее время для доступа к API поиска и моделей требуется подключение к Интернету. В будущем может поддерживать локальные модели, работающие полностью в автономном режиме.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...