TRV: быстрая генерация видеороликов для презентаций на основе слайдов/PPT и пояснительных записок
Общее введение
TRV - это инструмент с открытым исходным кодом, размещенный на GitHub и предназначенный для того, чтобы помочь пользователям быстро превратить слайды и конспекты лекций в видео с дикторским текстом. Он автоматически генерирует аудио- и видеоконтент из входящих файлов презентаций с помощью простых операций командной строки и подходит для преподавателей, создателей контента или разработчиков, которым необходимо быстро создавать презентационные видеоролики. Разработанный командой transformrs, проект поддерживает широкий спектр моделей и форматов генерации звука и доступен пользователям через локальное развертывание или онлайн-сервисы. TRV был разработан с учетом эффективности и гибкости, а открытый исходный код проекта дает техническим энтузиастам свободу в настройке и расширении функциональности.

Список функций
- Слайд к видео: Преобразование слайд-файлов в формате Typst в видео с дикторским текстом.
- Автоматическое генерирование звука: Генерация речи на основе текста с поддержкой нескольких речевых моделей и стилей.
- Поддержка нескольких форматов: Выходной звук поддерживает WAV и другие форматы, а видео - MP4.
- Совместимость с несколькими поставщиками услуг: Подключается к таким сервисам, как OpenAI, DeepInfra и другим, чтобы генерировать звук.
- Пользовательская конфигурация: Поддержка настройки разрешения, стиля голоса и других параметров.
- Поддержка DockerДля быстрого локального развертывания предусмотрены образы Docker.
- Адаптация вертикальных и горизонтальных экранов: Поддержка создания вертикальных видеороликов, подходящих для таких платформ, как YouTube Shorts.
Использование помощи
Процесс установки
TRV - это инструмент командной строки, для установки и использования которого требуются некоторые технические навыки. Ниже описаны подробные шаги по установке:
1. предварительные условия
- системные требования: Поддержка macOS, Linux или Windows (требуется среда командной строки).
- Зависимые инструменты::
- Git: используется для клонирования репозиториев кода.
- Docker (опционально): для развертывания контейнеров.
- Python (необязательно): если вы устанавливаете некоторые зависимости вручную.
- сетевое подключение: Некоторые функции требуют доступа к онлайн-сервисам.
2. Получение исходного кода через GitHub
- Откройте терминал и введите следующую команду, чтобы клонировать репозиторий:
git clone https://github.com/transformrs/trv.git
- Перейдите в каталог проектов:
cd trv
3. Выбор способа монтажа
- Способ 1: Использование Docker (рекомендуется)
- Убедитесь, что Docker установлен и запущен.
- Создайте образ Docker:
docker build --rm -t trv .
- Запустите контейнер:
docker run -it --rm trv
- Команда TRV доступна внутри контейнера.
- Способ 2: Ручная установка (локальная среда)
- Установите необходимые зависимости (например, FFmpeg, Typst и т.д. в зависимости от системы).
- Настройте переменные окружения и инструменты в соответствии с инструкциями на странице GitHub.
- Запустите исполняемый файл TRV напрямую (требуется компиляция или загрузка предварительно собранной версии).
4. Настройте сервисный ключ (необязательно)
Если вы используете DeepInfra или другой онлайн-сервис для генерации аудио, вам необходимо настроить ключ API:
- Получите ключ (например, DeepInfra's
DEEPINFRA_KEY
). - Установите переменные окружения в терминале:
export DEEPINFRA_KEY="你的密钥"
Использование
Основная функция TRV - преобразование слайд-файлов в видео:
1. Подготовка исходных документов
- Создайте демонстрационный файл в формате Typst (например.
presentation.typ
), содержащий содержимое слайдов и примечания к презентации. - Пример содержимого файла:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]
2. Генерация видео
- основная команда::
trv --input=presentation.typ --output=out.mp4
В результате будет создан видеофайл с конфигурацией по умолчанию out.mp4
.
- Использование онлайн-сервисов::
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav
Используйте сервис Kokoros для создания аудио в формате WAV и синтеза видео.
- Использование DeepInfra::
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male
Вам необходимо убедиться, что вы установили DEEPINFRA_KEY
.
3. Пользовательские настройки
- Настройка разрешения::
Для видео с вертикальным экраном (например, YouTube Shorts) этот параметр можно установить:
trv --input=presentation.typ --page=1080x1920
- Выберите стиль голоса::
четко и определенно указывать--voice
параметры, такие какamerican_male
возможноbm_lewis
Зависит от сервисной поддержки.
4. Просмотр вывода
- Созданное видео по умолчанию сохраняется в файле
_out/out.mp4
(Пути доступны через--output
(Назначение). - Проверьте сообщения журнала, чтобы убедиться, что аудио- и видеоклипы для каждого слайда созданы правильно.
Функциональное управление
Автоматическое генерирование звука
- Напишите заметки для презентации, и TRV сгенерирует речь из этих заметок.
- пройти (законопроект, проверку и т.д.)
--model
Укажите модель речи (например.tts-1
), через--voice
Выберите тон. - Пример:
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis
выходной диапазон bm_lewis
Тональность озвучивания видео.
Docker, запущенный локально
- Запускается внутри контейнера Docker:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
-v
Параметр монтирует локальный каталог, чтобы обеспечить доступ к файлам.
Видеопроизводство на вертикальном экране
- Установите размер страницы 1080x1920:
trv --input=presentation.typ --page=1080x1920
- Выходные файлы MP4 подходят для коротких видеоплатформ.
предостережение
- формат файла: В качестве входных данных должен быть файл Typst, если вы не знакомы с Typst, пожалуйста, обратитесь к официальной документации.
- зависимость от сети: Онлайн-сервис требует стабильной сети, поэтому для локального тестирования рекомендуется использовать Docker.
- требования к оборудованию: Если вы используете продвинутую модель (например, Zyphra Zonos), рекомендуется использовать 8 ГБ VRAM или облачный сервис.
Выполнив описанные выше действия, пользователи смогут быстро приступить к работе с TRV, превращая слайды в профессиональные видеоролики и повышая эффективность создания контента.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...