PDF2Audio: инструмент для преобразования PDF в аудио, PDF в подкасты

Общее введение

PDF2Audio - это проект с открытым исходным кодом, предназначенный для преобразования PDF-файлов в аудиоконтент, такой как подкасты, лекции и конспекты. Инструмент использует модель OpenAI GPT для генерации текста и преобразования текста в речь, позволяя пользователям загружать несколько PDF-файлов, выбирать различные шаблоны инструкций (например, подкасты, лекции, конспекты и т. д.) и настраивать модель генерации текста и аудио. pdf2Audio предлагает широкий спектр вариантов речи и позволяет пользователям итеративно улучшать аудиоконтент, редактируя черновики и предоставляя обратную связь.

Рекомендуемые сопутствующие товары:NotebookLM: чтение с извлечением заметок о знаниях, генерация документов нескольких классов, голосовой диалог подкастов

 

PDF2Audio:将PDF转换为音频的工具,PDF转播客

 

Список функций

  • Загрузка нескольких файлов PDF
  • Выбирайте различные шаблоны обучения (подкасты, лекции, конспекты и т. д.)
  • Генерация текста и моделирование звука на заказ
  • Выберите другой голос
  • Итеративно улучшайте аудиоконтент, редактируя черновики и предоставляя обратную связь
  • Поддержка локальной установки и использования

 

Интерфейс PDF2Audio

Интерфейс PDF2Audio очень прост и состоит из следующих шагов:

1. Загрузите один или несколько файлов PDF
2. Выберите нужный шаблон инструкции

PDF2Audio:将PDF转换为音频的工具,PDF转播客

 

3. Индивидуальные шаблоны инструкций, если требуется
4. Нажмите кнопку "Создать аудио", чтобы создать аудиоконтент.

PDF2Audio:将PDF转换为音频的工具,PDF转播客

 

Использование помощи

Опыт работы в Интернете

https://huggingface.co/spaces/lamm-mit/PDF2Audio

https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb

 

Процесс локальной установки

  1. склад клонов: Выполните следующую команду в терминале, чтобы клонировать репозиторий PDF2Audio:
    git clone https://github.com/lamm-mit/PDF2Audio.git
    cd PDF2Audio
    
  2. Установка Miniconda: Если Miniconda еще не установлена, загрузите программу установки с веб-сайта Miniconda и следуйте инструкциям по установке для вашей операционной системы. Убедитесь, что установка прошла успешно:
    conda --version
    
  3. Создание среды Conda: Создайте новую среду Conda, выполнив следующую команду в терминале:
    conda create -n pdf2audio python=3.9
    conda activate pdf2audio
    
  4. Установка зависимостей: Выполните следующую команду в терминале, чтобы установить необходимые зависимости:
    pip install -r requirements.txt
    
  5. Установка ключа API OpenAI: Создать .env и добавьте свой ключ API OpenAI:
    OPENAI_API_KEY=your_api_key_here
    

Процесс использования

  1. Запуск приложения: Убедитесь, что вы находитесь в каталоге проекта и что среда Conda активирована:
    conda activate pdf2audio
    python app.py
    
  2. Откройте браузер: В терминале указывается URL-адрес, обычно это http://localhost:7860URL-адрес откроется в вашем браузере.
  3. Загрузка файлов PDF: Загрузите один или несколько PDF-файлов с помощью интерфейса Gradio.
  4. Выбор шаблона команды: Выберите нужный вам шаблон инструкции (например, подкаст, лекция, конспект и т. д.).
  5. Пользовательские команды: Настройте инструкции по своему усмотрению.
  6. Генерировать аудио: Нажмите кнопку "Создать аудио", чтобы создать аудиоконтент.

предостережение

  • Для работы приложения требуется ключ API OpenAI.
  • Вы можете итеративно улучшать аудиоконтент, редактируя черновики и предоставляя конкретные или общие отзывы.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...