PDF2Audio: инструмент для преобразования PDF в аудио, PDF в подкасты
Общее введение
PDF2Audio - это проект с открытым исходным кодом, предназначенный для преобразования PDF-файлов в аудиоконтент, такой как подкасты, лекции и конспекты. Инструмент использует модель OpenAI GPT для генерации текста и преобразования текста в речь, позволяя пользователям загружать несколько PDF-файлов, выбирать различные шаблоны инструкций (например, подкасты, лекции, конспекты и т. д.) и настраивать модель генерации текста и аудио. pdf2Audio предлагает широкий спектр вариантов речи и позволяет пользователям итеративно улучшать аудиоконтент, редактируя черновики и предоставляя обратную связь.
Рекомендуемые сопутствующие товары:NotebookLM: чтение с извлечением заметок о знаниях, генерация документов нескольких классов, голосовой диалог подкастов

Список функций
- Загрузка нескольких файлов PDF
- Выбирайте различные шаблоны обучения (подкасты, лекции, конспекты и т. д.)
- Генерация текста и моделирование звука на заказ
- Выберите другой голос
- Итеративно улучшайте аудиоконтент, редактируя черновики и предоставляя обратную связь
- Поддержка локальной установки и использования
Интерфейс PDF2Audio
Интерфейс PDF2Audio очень прост и состоит из следующих шагов:
1. Загрузите один или несколько файлов PDF
2. Выберите нужный шаблон инструкции

3. Индивидуальные шаблоны инструкций, если требуется
4. Нажмите кнопку "Создать аудио", чтобы создать аудиоконтент.

Использование помощи
Опыт работы в Интернете
https://huggingface.co/spaces/lamm-mit/PDF2Audio
https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb
Процесс локальной установки
- склад клонов: Выполните следующую команду в терминале, чтобы клонировать репозиторий PDF2Audio:
git clone https://github.com/lamm-mit/PDF2Audio.git cd PDF2Audio
- Установка Miniconda: Если Miniconda еще не установлена, загрузите программу установки с веб-сайта Miniconda и следуйте инструкциям по установке для вашей операционной системы. Убедитесь, что установка прошла успешно:
conda --version
- Создание среды Conda: Создайте новую среду Conda, выполнив следующую команду в терминале:
conda create -n pdf2audio python=3.9 conda activate pdf2audio
- Установка зависимостей: Выполните следующую команду в терминале, чтобы установить необходимые зависимости:
pip install -r requirements.txt
- Установка ключа API OpenAI: Создать
.env
и добавьте свой ключ API OpenAI:OPENAI_API_KEY=your_api_key_here
Процесс использования
- Запуск приложения: Убедитесь, что вы находитесь в каталоге проекта и что среда Conda активирована:
conda activate pdf2audio python app.py
- Откройте браузер: В терминале указывается URL-адрес, обычно это
http://localhost:7860
URL-адрес откроется в вашем браузере. - Загрузка файлов PDF: Загрузите один или несколько PDF-файлов с помощью интерфейса Gradio.
- Выбор шаблона команды: Выберите нужный вам шаблон инструкции (например, подкаст, лекция, конспект и т. д.).
- Пользовательские команды: Настройте инструкции по своему усмотрению.
- Генерировать аудио: Нажмите кнопку "Создать аудио", чтобы создать аудиоконтент.
предостережение
- Для работы приложения требуется ключ API OpenAI.
- Вы можете итеративно улучшать аудиоконтент, редактируя черновики и предоставляя конкретные или общие отзывы.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...