TRV : Générer rapidement des vidéos de présentation à partir de diapositives/PPT et de notes explicatives
Introduction générale
TRV est un outil open source, hébergé sur GitHub, conçu pour aider les utilisateurs à transformer rapidement des diapositives et des notes de cours en vidéos avec narration. Il génère automatiquement du contenu audio et vidéo à partir de fichiers de présentation entrants grâce à de simples opérations en ligne de commande, et convient aux éducateurs, aux créateurs de contenu ou aux développeurs qui ont besoin de créer rapidement des vidéos de présentation. Développé par l'équipe transformrs, le projet prend en charge un large éventail de modèles et de formats de génération audio, et est disponible pour les utilisateurs via un déploiement local ou des services en ligne. TRV a été conçu dans un souci d'efficacité et de flexibilité, et la nature open source du projet donne aux passionnés de technologie la liberté de personnaliser et d'étendre les fonctionnalités.

Liste des fonctions
- Glisser vers la vidéoConversion de fichiers de diapositives au format Typst en vidéo avec narration.
- Génération automatique d'audio: Génération de la parole à partir du texte avec prise en charge de plusieurs modèles et styles de parole.
- Support multiformatLa sortie audio prend en charge le format WAV et d'autres formats, et la sortie vidéo prend en charge le format MP4.
- Compatibilité avec plusieurs fournisseurs de servicesLes services de production de son : se connecte à des services tels que OpenAI, DeepInfra, etc. pour générer du son.
- Configuration personnaliséeLes données de l'appareil sont accessibles à partir de l'écran de l'ordinateur et de l'interface utilisateur.
- Support DockerLes images Docker sont fournies pour un déploiement local rapide.
- Adaptation des écrans horizontaux et verticauxLes vidéos verticales : aide à la création de vidéos verticales adaptées à des plateformes telles que YouTube Shorts.
Utiliser l'aide
Processus d'installation
TRV est un outil en ligne de commande dont l'installation et l'utilisation nécessitent quelques compétences techniques. Voici les étapes détaillées de l'installation :
1. les conditions préalables
- exigences du systèmeLes logiciels d'aide à la décision : Prise en charge de macOS, Linux ou Windows (environnement de ligne de commande requis).
- Outils dépendants: :
- Git : utilisé pour cloner les dépôts de code.
- Docker (facultatif) : pour un déploiement en conteneur.
- Python (facultatif) : si vous installez certaines dépendances manuellement.
- connexion au réseauCertaines fonctions nécessitent l'accès à des services en ligne.
2. obtenir le code source via GitHub
- Ouvrez un terminal et entrez la commande suivante pour cloner le dépôt :
git clone https://github.com/transformrs/trv.git
- Accédez au catalogue de projets :
cd trv
3) Choix de la méthode de montage
- Méthode 1 : Utiliser Docker (recommandé)
- Assurez-vous que Docker est installé et fonctionne.
- Construire l'image Docker :
docker build --rm -t trv .
- Exécuter le conteneur :
docker run -it --rm trv
- La commande TRV est disponible à l'intérieur du conteneur.
- Mode 2 : Installation manuelle (environnement local)
- Installer les dépendances nécessaires (par exemple FFmpeg, Typst, etc. selon le système).
- Configurez les variables d'environnement et les outils selon les instructions de la page GitHub.
- Exécuter directement l'exécutable TRV (une compilation ou le téléchargement d'une version préconstruite est nécessaire).
4. configurer la clé de service (facultatif)
Si vous utilisez DeepInfra ou un autre service en ligne pour générer de l'audio, vous devez configurer la clé API :
- Obtenir la clé (par exemple, DeepInfra's
DEEPINFRA_KEY
). - Définir les variables d'environnement dans le terminal :
export DEEPINFRA_KEY="你的密钥"
Utilisation
La fonction principale de TRV est de convertir les fichiers de diapositives en vidéo, et la procédure d'opération spécifique est décrite ci-dessous :
1. préparation des documents d'entrée
- Créer un fichier de démonstration au format Typst (par ex.
presentation.typ
), contenant le contenu des diapositives et les notes de présentation. - Exemple de contenu de fichier :
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]
2. génération de vidéos
- commandement de base: :
trv --input=presentation.typ --output=out.mp4
Cette opération génère un fichier vidéo avec la configuration par défaut. out.mp4
.
- Utilisation des services en ligne: :
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav
Utilisez le service Kokoros pour générer du son WAV et de la vidéo composite.
- Utilisation de DeepInfra: :
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male
Vous devez vous assurer que vous avez défini l'option DEEPINFRA_KEY
.
3) Paramètres personnalisés
- Ajustement de la résolution: :
Pour les vidéos à écran vertical (par exemple, les courts métrages YouTube), ce paramètre peut être défini :
trv --input=presentation.typ --page=1080x1920
- Sélectionner le style de voix: :
indiquer clairement et avec certitude--voice
paramètres, tels queamerican_male
peut-êtrebm_lewis
Cela dépend du service d'assistance.
4) Visualisation de la sortie
- La vidéo générée est enregistrée par défaut dans le fichier
_out/out.mp4
(Les chemins sont disponibles via--output
(Désignation). - Vérifiez les messages du journal pour vous assurer que les clips audio et vidéo de chaque diapositive sont générés correctement.
Fonction en vedette Fonctionnement
Génération automatique d'audio
- Rédigez des notes pour une présentation et TRV générera un discours à partir de ces notes.
- faire passer (un projet de loi, une inspection, etc.)
--model
Spécifiez le modèle vocal (par ex.tts-1
), par l'intermédiaire de--voice
Sélectionnez la tonalité. - Exemple :
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis
bande de sortie bm_lewis
Ton de la vidéo en voix off.
Docker exécuté localement
- S'exécute dans un conteneur Docker :
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
-v
monte le répertoire local pour s'assurer que les fichiers sont accessibles.
Production vidéo sur écran vertical
- Réglez la taille de la page sur 1080x1920 :
trv --input=presentation.typ --page=1080x1920
- La sortie de fichiers MP4 est adaptée aux plateformes vidéo de courte durée.
mise en garde
- format de fichierL'entrée doit être un fichier Typst, si vous n'êtes pas familier avec Typst, veuillez vous référer à la documentation officielle.
- dépendance à l'égard du réseauLe service en ligne nécessite un réseau stable, et il est recommandé d'utiliser Docker pour les tests locaux.
- exigences en matière de matérielSi vous utilisez un modèle avancé (tel que Zyphra Zonos), il est recommandé d'avoir 8 Go de VRAM ou de faire appel à un service de cloud computing.
Avec les étapes ci-dessus, les utilisateurs peuvent rapidement commencer à utiliser TRV, transformer des diapositives en vidéos professionnelles et améliorer l'efficacité de la création de contenu.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...