Open NotebookLM: конвертация PDF в подкасты с открытым исходным кодом

Общее введение

Открыть NotebookLM это проект с открытым исходным кодом, предназначенный для преобразования любого PDF-документа в подкаст. Инструмент использует открытые модели Large Language Models (LLM) и Text-to-Speech (TTS) для обработки PDF-контента, генерации естественного диалога, подходящего для аудиоподкастов, и вывода в MP3-файлы. Вдохновленный инструментом NotebookLM, проект использует такие технологии, как Llama 3.3 70B, Fireworks AI, MeloTTS, Bark и Jina Reader. Пользователи могут загружать PDF-документы через простой интерфейс, чтобы генерировать информативные и интересные диалоги для подкастов.

Open NotebookLM:将PDF转换为播客的开源工具

 

Список функций

  • PDF в подкаст: Загрузите PDF-документ, чтобы преобразовать его содержимое в подкаст-диалог.
  • Создание естественных диалогов: Создавайте информативные диалоги, которые должны быть одновременно образовательными и развлекательными.
  • удобный интерфейс: Используйте Gradio для создания простого интерактивного интерфейса.
  • Поддержка нескольких языков: Поддерживается создание подкастов на 13 языках.

 

Использование помощи

Процесс установки

  1. Хранилище клонирования:
   git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
  1. Создайте виртуальную среду и активируйте ее:
   python -m venv .venv
source .venv/bin/activate
  1. Установите необходимые пакеты:
   pip install -r requirements.txt

Процесс использования

  1. Установите ключ API:
    • Установка ключа API Fireworks в качестве переменной средыFIREWORKS_API_KEY.
  2. Запустите приложение:
   python app.py

Это приведет к запуску интерфейса Gradio.

  1. Загрузить PDF:
    • Загрузите PDF-документ, который вы хотите преобразовать в подкаст, в интерфейс.
  2. Генерируйте звук:
    • Нажмите на кнопку, чтобы начать процесс конвертации, и на выходе вы получите MP3-файл с диалогом подкаста.

Подробный порядок работы функций

  1. PDF Загрузка: Выбор и загрузка PDF-файлов в интерфейсе Gradio.
  2. Создание диалогов: Система автоматически обрабатывает PDF-контент для создания естественного диалога.
  3. аудиовыход: Нажмите кнопку Generate, и система выведет файл подкаста в формате MP3.
  4. Поддержка нескольких языков: Выберите нужный язык в настройках, и система создаст подкаст на соответствующем языке в соответствии с выбором.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...