TRV: Generación rápida de vídeos de presentación a partir de diapositivas/PPT y notas explicativas
Últimos recursos sobre IAPublicado hace 6 meses Círculo de intercambio de inteligencia artificial 1.7K 00
Introducción general
TRV es una herramienta de código abierto, alojada en GitHub, diseñada para ayudar a los usuarios a convertir rápidamente diapositivas y notas de clase en vídeos con narración. Genera automáticamente contenidos de audio y vídeo a partir de archivos de presentación entrantes mediante sencillas operaciones de línea de comandos, y es adecuada para educadores, creadores de contenidos o desarrolladores que necesiten crear rápidamente vídeos de presentación. Desarrollado por el equipo de transformrs, el proyecto admite una amplia gama de modelos y formatos de generación de audio, y está a disposición de los usuarios mediante despliegue local o servicios en línea. TRV se diseñó pensando en la eficacia y la flexibilidad, y la naturaleza de código abierto del proyecto ofrece a los entusiastas de la tecnología la libertad de personalizar y ampliar sus funciones.

Lista de funciones
- Deslizar a vídeoConvierte archivos de diapositivas con formato Typst a vídeo con narración.
- Generación automática de audio: Generación de voz basada en texto con soporte para múltiples modelos y estilos de voz.
- Soporte multiformatoEl audio de salida es compatible con WAV y otros formatos, y el vídeo es compatible con MP4.
- Compatibilidad con múltiples proveedores de servicios: Se conecta a servicios como OpenAI, DeepInfra y otros para generar audio.
- Configuración personalizada: Permite ajustar la resolución, el estilo de voz y otros parámetros.
- Soporte DockerSe proporcionan imágenes Docker para un despliegue local rápido.
- Adaptación de pantallas horizontales y verticalesSoporte para generar vídeos verticales aptos para plataformas como YouTube Shorts.
Utilizar la ayuda
Proceso de instalación
TRV es una herramienta de línea de comandos que requiere algunos conocimientos técnicos para su instalación y uso. A continuación se detallan los pasos de instalación:
1. Condiciones previas
- requisitos del sistemaCompatibilidad con macOS, Linux o Windows (se requiere un entorno de línea de comandos).
- Herramientas dependientes::
- Git: Se utiliza para clonar repositorios de código.
- Docker (opcional): para el despliegue en contenedores.
- Python (opcional): si instala algunas de las dependencias manualmente.
- conexión de red: Algunas funciones requieren el acceso a servicios en línea.
2. Obtener el código fuente a través de GitHub
- Abra un terminal e introduzca el siguiente comando para clonar el repositorio:
git clone https://github.com/transformrs/trv.git
- Vaya al catálogo de proyectos:
cd trv
3. Selección del método de montaje
- Forma 1: Utilizar Docker (recomendado)
- Asegúrese de que Docker está instalado y en funcionamiento.
- Cree la imagen Docker:
docker build --rm -t trv .
- Ejecuta el contenedor:
docker run -it --rm trv
- El comando TRV está disponible dentro del contenedor.
- Modo 2: Instalación manual (entorno local)
- Instale las dependencias necesarias (por ejemplo, FFmpeg, Typst, etc. dependiendo del sistema).
- Configura las variables de entorno y las herramientas según las instrucciones de la página de GitHub.
- Ejecute directamente el ejecutable TRV (es necesario compilar o descargar una versión precompilada).
4. Configurar la clave de servicio (opcional)
Si utiliza DeepInfra u otro servicio en línea para generar audio, deberá configurar la clave API:
- Obtener la clave (por ejemplo, DeepInfra's
DEEPINFRA_KEY
). - Establezca las variables de entorno en el terminal:
export DEEPINFRA_KEY="你的密钥"
Utilización
La función principal de TRV es convertir archivos de diapositivas a vídeo, y el siguiente es el procedimiento específico de operación:
1. Preparación de los documentos de entrada
- Cree un archivo de demostración en formato Typst (por ejemplo
presentation.typ
), que contiene el contenido de las diapositivas y las notas de la presentación. - Ejemplo de contenido de archivo:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]
2. Generación de vídeo
- mando básico::
trv --input=presentation.typ --output=out.mp4
Esto generará un archivo de vídeo con la configuración por defecto out.mp4
.
- Uso de servicios en línea::
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav
Utiliza el servicio Kokoros para generar audio WAV y sintetizar vídeo.
- Uso de DeepInfra::
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male
Debe asegurarse de que ha configurado la opción DEEPINFRA_KEY
.
3. Ajustes personalizados
- Ajuste de la resolución::
Para vídeos en pantalla vertical (por ejemplo, YouTube Shorts), se puede configurar:
trv --input=presentation.typ --page=1080x1920
- Seleccionar estilo de voz::
indicar claramente y con certeza--voice
parámetros, comoamerican_male
tal vezbm_lewis
Depende del servicio de asistencia.
4. Visualización de la salida
- El vídeo generado se guarda por defecto en la carpeta
_out/out.mp4
(Las rutas están disponibles en--output
(Designación). - Compruebe los mensajes de registro para asegurarse de que los clips de audio y vídeo de cada diapositiva se generan sin errores.
Función destacada Operación
Generación automática de audio
- Escriba notas para una presentación y TRV generará el discurso a partir de las notas.
- aprobar (una factura o inspección, etc.)
--model
Especifique el modelo de voz (p. ej.tts-1
), a través de--voice
Selecciona el tono. - Ejemplo:
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis
banda de salida bm_lewis
Tono del vídeo locutado.
Docker ejecutándose localmente
- Se ejecuta dentro de un contenedor Docker:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
-v
monta el directorio local para garantizar el acceso a los archivos.
Producción de vídeo en pantalla vertical
- Ajuste el tamaño de la página a 1080x1920:
trv --input=presentation.typ --page=1080x1920
- Salida de archivos MP4 adecuados para plataformas de vídeo de corta duración.
advertencia
- formato de archivoLa entrada debe ser un archivo Typst. Si no está familiarizado con Typst, consulte la documentación oficial.
- dependencia de la red: El servicio en línea requiere una red estable, por lo que se recomienda utilizar Docker para las pruebas locales.
- requisitos de hardwareSi utilizas un modelo avanzado (como Zyphra Zonos), se recomiendan 8 GB de VRAM o un servicio en la nube.
Con los pasos anteriores, los usuarios pueden empezar a utilizar TRV rápidamente, transformando diapositivas en vídeos profesionales y mejorando la eficacia de la creación de contenidos.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...