TRV：将幻灯片/PPT和讲解备注快速生成演讲视频

81.2K 00

综合介绍

TRV 是一个开源工具，托管于 GitHub，旨在帮助用户将幻灯片和演讲笔记快速转化为带有旁白的视频。它通过简单的命令行操作，将输入的演示文稿文件自动生成音频和视频内容，适合需要快速制作演示视频的教育工作者、内容创作者或开发者。项目由 transformrs 团队开发，支持多种音频生成模型和格式，用户可通过本地部署或在线服务使用。TRV 的设计注重效率与灵活性，开源特性也让技术爱好者能够自由定制和扩展功能。

功能列表

幻灯片转视频：将 Typst 格式的幻灯片文件转换为带有旁白的视频。
自动音频生成：基于文本生成语音，支持多种语音模型和风格。
多格式支持：输出音频支持 WAV 等格式，视频支持 MP4。
多种服务提供商兼容：可连接 OpenAI、DeepInfra 等服务生成音频。
自定义配置：支持调整分辨率、语音风格及其他参数。
Docker 支持：提供 Docker 镜像，便于本地快速部署。
横竖屏适配：支持生成适合 YouTube Shorts 等平台的竖屏视频。

使用帮助

安装流程

TRV 是一个命令行工具，需要一定的技术基础来安装和使用。以下是详细的安装步骤：

1. 前置条件

系统要求：支持 macOS、Linux 或 Windows（需命令行环境）。
依赖工具：
- Git：用于克隆代码仓库。
- Docker（可选）：用于容器化部署。
- Python（可选）：若手动安装部分依赖。
网络连接：部分功能需访问在线服务。

2. 通过 GitHub 获取源码

打开终端，输入以下命令克隆仓库：

git clone https://github.com/transformrs/trv.git

cd trv

3. 选择安装方式

方式一：使用 Docker（推荐）

确保 Docker 已安装并运行。
构建 Docker 镜像：

docker build --rm -t trv .

运行容器：

docker run -it --rm trv

在容器内即可使用 TRV 命令。

方式二：手动安装（本地环境）

安装必要的依赖（如 FFmpeg、Typst 等，具体依赖视系统而定）。
根据 GitHub 页面说明配置环境变量和工具。
直接运行 TRV 可执行文件（需编译或下载预构建版本）。

4. 配置服务密钥（可选）

若使用 DeepInfra 或其他在线服务生成音频，需配置 API 密钥：

获取密钥（如 DeepInfra 的 DEEPINFRA_KEY）。
在终端设置环境变量：

export DEEPINFRA_KEY="你的密钥"

使用方法

TRV 的核心功能是将幻灯片文件转为视频，以下是具体操作流程：

1. 准备输入文件

创建一个 Typst 格式的演示文件（如 presentation.typ），包含幻灯片内容和演讲笔记。
示例文件内容：

#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示，欢迎体验 TRV 的自动化功能。]

2. 生成视频

基本命令：

trv --input=presentation.typ --output=out.mp4

这将生成一个默认配置的视频文件 out.mp4。

使用在线服务：

trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav

使用 Kokoros 服务生成 WAV 音频并合成视频。

使用 DeepInfra：

trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male

需确保已设置 DEEPINFRA_KEY。

3. 自定义设置

调整分辨率：
对于竖屏视频（如 YouTube Shorts），可设置：

trv --input=presentation.typ --page=1080x1920

选择语音风格：
指定 --voice 参数，如 american_male 或 bm_lewis，视服务支持而定。

4. 查看输出

生成的视频默认保存在 _out/out.mp4（路径可通过 --output 指定）。
检查日志信息，确保每张幻灯片的音频和视频片段生成无误。

特色功能操作

自动音频生成

编写演讲笔记，TRV 会根据笔记生成语音。
通过 --model 指定语音模型（如 tts-1），通过 --voice 选择音色。
示例：

trv --input=presentation.typ --model=tts-1 --voice=bm_lewis

输出带 bm_lewis 音色的旁白视频。

Docker 本地运行

在 Docker 容器内运行：

docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ

-v 参数挂载本地目录，确保文件可访问。

竖屏视频制作

设置页面尺寸为 1080x1920：

trv --input=presentation.typ --page=1080x1920

输出适合短视频平台的 MP4 文件。

注意事项

文件格式：输入需为 Typst 文件，若不熟悉 Typst，可参考官方文档。
网络依赖：在线服务需稳定网络，建议本地测试时使用 Docker。
硬件要求：如使用高级模型（如 Zyphra Zonos），建议 8GB VRAM 或借助云服务。

通过以上步骤，用户可快速上手 TRV，将幻灯片转化为专业视频，提升内容创作效率。

最新AI资源 # AI开源项目 # AI视频生成工具

文章版权归 AI分享圈所有，未经允许请勿转载。

Sparkify - 谷歌推出的AI动画视频生成平台

最新AI资源

9个月前

046.2K

HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

最新AI资源

10个月前

042.6K

nanochat - Karpathy免费开源的低成本模型训练项目

最新AI资源

5个月前

032.2K

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

最新AI资源

2周前

010.7K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

TRV：将幻灯片/PPT和讲解备注快速生成演讲视频

综合介绍

功能列表

使用帮助

安装流程

1. 前置条件

2. 通过 GitHub 获取源码

3. 选择安装方式

4. 配置服务密钥（可选）

使用方法

1. 准备输入文件

2. 生成视频

3. 自定义设置

4. 查看输出

特色功能操作

自动音频生成

Docker 本地运行

竖屏视频制作

注意事项

Cardog：车辆信息研究与汽车市场数据智能分析

arXiv Paper Visualizer：arXiv论文推荐与可视化解读

相关文章

Sparkify - 谷歌推出的AI动画视频生成平台

HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

nanochat - Karpathy免费开源的低成本模型训练项目

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

暂无评论

最新收录

最新文章

TRV：将幻灯片/PPT和讲解备注快速生成演讲视频

综合介绍

功能列表

使用帮助

安装流程

1. 前置条件

2. 通过 GitHub 获取源码

3. 选择安装方式

4. 配置服务密钥（可选）

使用方法

1. 准备输入文件

2. 生成视频

3. 自定义设置

4. 查看输出

特色功能操作

自动音频生成

Docker 本地运行

竖屏视频制作

注意事项

Cardog：车辆信息研究与汽车市场数据智能分析

arXiv Paper Visualizer：arXiv论文推荐与可视化解读

相关文章

Sparkify - 谷歌推出的AI动画视频生成平台

HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

nanochat - Karpathy免费开源的低成本模型训练项目

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

暂无评论

AI工具精选

最新收录

最新文章