TRV: быстрая генерация видеороликов для презентаций на основе слайдов/PPT и пояснительных записок

Общее введение

TRV - это инструмент с открытым исходным кодом, размещенный на GitHub и предназначенный для того, чтобы помочь пользователям быстро превратить слайды и конспекты лекций в видео с дикторским текстом. Он автоматически генерирует аудио- и видеоконтент из входящих файлов презентаций с помощью простых операций командной строки и подходит для преподавателей, создателей контента или разработчиков, которым необходимо быстро создавать презентационные видеоролики. Разработанный командой transformrs, проект поддерживает широкий спектр моделей и форматов генерации звука и доступен пользователям через локальное развертывание или онлайн-сервисы. TRV был разработан с учетом эффективности и гибкости, а открытый исходный код проекта дает техническим энтузиастам свободу в настройке и расширении функциональности.

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

 

Список функций

  • Слайд к видео: Преобразование слайд-файлов в формате Typst в видео с дикторским текстом.
  • Автоматическое генерирование звука: Генерация речи на основе текста с поддержкой нескольких речевых моделей и стилей.
  • Поддержка нескольких форматов: Выходной звук поддерживает WAV и другие форматы, а видео - MP4.
  • Совместимость с несколькими поставщиками услуг: Подключается к таким сервисам, как OpenAI, DeepInfra и другим, чтобы генерировать звук.
  • Пользовательская конфигурация: Поддержка настройки разрешения, стиля голоса и других параметров.
  • Поддержка DockerДля быстрого локального развертывания предусмотрены образы Docker.
  • Адаптация вертикальных и горизонтальных экранов: Поддержка создания вертикальных видеороликов, подходящих для таких платформ, как YouTube Shorts.

 

Использование помощи

Процесс установки

TRV - это инструмент командной строки, для установки и использования которого требуются некоторые технические навыки. Ниже описаны подробные шаги по установке:

1. предварительные условия

  • системные требования: Поддержка macOS, Linux или Windows (требуется среда командной строки).
  • Зависимые инструменты::
    • Git: используется для клонирования репозиториев кода.
    • Docker (опционально): для развертывания контейнеров.
    • Python (необязательно): если вы устанавливаете некоторые зависимости вручную.
  • сетевое подключение: Некоторые функции требуют доступа к онлайн-сервисам.

2. Получение исходного кода через GitHub

  1. Откройте терминал и введите следующую команду, чтобы клонировать репозиторий:
git clone https://github.com/transformrs/trv.git
  1. Перейдите в каталог проектов:
cd trv

3. Выбор способа монтажа

  • Способ 1: Использование Docker (рекомендуется)
  1. Убедитесь, что Docker установлен и запущен.
  2. Создайте образ Docker:
docker build --rm -t trv .
  1. Запустите контейнер:
docker run -it --rm trv
  1. Команда TRV доступна внутри контейнера.
  • Способ 2: Ручная установка (локальная среда)
  1. Установите необходимые зависимости (например, FFmpeg, Typst и т.д. в зависимости от системы).
  2. Настройте переменные окружения и инструменты в соответствии с инструкциями на странице GitHub.
  3. Запустите исполняемый файл TRV напрямую (требуется компиляция или загрузка предварительно собранной версии).

4. Настройте сервисный ключ (необязательно)

Если вы используете DeepInfra или другой онлайн-сервис для генерации аудио, вам необходимо настроить ключ API:

  1. Получите ключ (например, DeepInfra's DEEPINFRA_KEY).
  2. Установите переменные окружения в терминале:
export DEEPINFRA_KEY="你的密钥"

Использование

Основная функция TRV - преобразование слайд-файлов в видео:

1. Подготовка исходных документов

  • Создайте демонстрационный файл в формате Typst (например. presentation.typ), содержащий содержимое слайдов и примечания к презентации.
  • Пример содержимого файла:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]

2. Генерация видео

  • основная команда::
trv --input=presentation.typ --output=out.mp4

В результате будет создан видеофайл с конфигурацией по умолчанию out.mp4.

  • Использование онлайн-сервисов::
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav

Используйте сервис Kokoros для создания аудио в формате WAV и синтеза видео.

  • Использование DeepInfra::
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male

Вам необходимо убедиться, что вы установили DEEPINFRA_KEY.

3. Пользовательские настройки

  • Настройка разрешения::
    Для видео с вертикальным экраном (например, YouTube Shorts) этот параметр можно установить:
trv --input=presentation.typ --page=1080x1920
  • Выберите стиль голоса::
    четко и определенно указывать --voice параметры, такие как american_male возможно bm_lewisЗависит от сервисной поддержки.

4. Просмотр вывода

  • Созданное видео по умолчанию сохраняется в файле _out/out.mp4(Пути доступны через --output (Назначение).
  • Проверьте сообщения журнала, чтобы убедиться, что аудио- и видеоклипы для каждого слайда созданы правильно.

Функциональное управление

Автоматическое генерирование звука

  1. Напишите заметки для презентации, и TRV сгенерирует речь из этих заметок.
  2. пройти (законопроект, проверку и т.д.) --model Укажите модель речи (например. tts-1), через --voice Выберите тон.
  3. Пример:
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis

выходной диапазон bm_lewis Тональность озвучивания видео.

Docker, запущенный локально

  1. Запускается внутри контейнера Docker:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
  1. -v Параметр монтирует локальный каталог, чтобы обеспечить доступ к файлам.

Видеопроизводство на вертикальном экране

  1. Установите размер страницы 1080x1920:
trv --input=presentation.typ --page=1080x1920
  1. Выходные файлы MP4 подходят для коротких видеоплатформ.

предостережение

  • формат файла: В качестве входных данных должен быть файл Typst, если вы не знакомы с Typst, пожалуйста, обратитесь к официальной документации.
  • зависимость от сети: Онлайн-сервис требует стабильной сети, поэтому для локального тестирования рекомендуется использовать Docker.
  • требования к оборудованию: Если вы используете продвинутую модель (например, Zyphra Zonos), рекомендуется использовать 8 ГБ VRAM или облачный сервис.

Выполнив описанные выше действия, пользователи смогут быстро приступить к работе с TRV, превращая слайды в профессиональные видеоролики и повышая эффективность создания контента.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...