Open NotebookLM: конвертация PDF в подкасты с открытым исходным кодом
Общее введение
Открыть NotebookLM это проект с открытым исходным кодом, предназначенный для преобразования любого PDF-документа в подкаст. Инструмент использует открытые модели Large Language Models (LLM) и Text-to-Speech (TTS) для обработки PDF-контента, генерации естественного диалога, подходящего для аудиоподкастов, и вывода в MP3-файлы. Вдохновленный инструментом NotebookLM, проект использует такие технологии, как Llama 3.3 70B, Fireworks AI, MeloTTS, Bark и Jina Reader. Пользователи могут загружать PDF-документы через простой интерфейс, чтобы генерировать информативные и интересные диалоги для подкастов.

Список функций
- PDF в подкаст: Загрузите PDF-документ, чтобы преобразовать его содержимое в подкаст-диалог.
- Создание естественных диалогов: Создавайте информативные диалоги, которые должны быть одновременно образовательными и развлекательными.
- удобный интерфейс: Используйте Gradio для создания простого интерактивного интерфейса.
- Поддержка нескольких языков: Поддерживается создание подкастов на 13 языках.
Использование помощи
Процесс установки
- Хранилище клонирования:
git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
- Создайте виртуальную среду и активируйте ее:
python -m venv .venv
source .venv/bin/activate
- Установите необходимые пакеты:
pip install -r requirements.txt
Процесс использования
- Установите ключ API:
- Установка ключа API Fireworks в качестве переменной среды
FIREWORKS_API_KEY
.
- Установка ключа API Fireworks в качестве переменной среды
- Запустите приложение:
python app.py
Это приведет к запуску интерфейса Gradio.
- Загрузить PDF:
- Загрузите PDF-документ, который вы хотите преобразовать в подкаст, в интерфейс.
- Генерируйте звук:
- Нажмите на кнопку, чтобы начать процесс конвертации, и на выходе вы получите MP3-файл с диалогом подкаста.
Подробный порядок работы функций
- PDF Загрузка: Выбор и загрузка PDF-файлов в интерфейсе Gradio.
- Создание диалогов: Система автоматически обрабатывает PDF-контент для создания естественного диалога.
- аудиовыход: Нажмите кнопку Generate, и система выведет файл подкаста в формате MP3.
- Поддержка нескольких языков: Выберите нужный язык в настройках, и система создаст подкаст на соответствующем языке в соответствии с выбором.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...