AI个人学习
和实操指南
资源推荐1

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

综合介绍

TRV 是一个开源工具,托管于 GitHub,旨在帮助用户将幻灯片和演讲笔记快速转化为带有旁白的视频。它通过简单的命令行操作,将输入的演示文稿文件自动生成音频和视频内容,适合需要快速制作演示视频的教育工作者、内容创作者或开发者。项目由 transformrs 团队开发,支持多种音频生成模型和格式,用户可通过本地部署或在线服务使用。TRV 的设计注重效率与灵活性,开源特性也让技术爱好者能够自由定制和扩展功能。

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频-1


 

功能列表

  • 幻灯片转视频:将 Typst 格式的幻灯片文件转换为带有旁白的视频。
  • 自动音频生成:基于文本生成语音,支持多种语音模型和风格。
  • 多格式支持:输出音频支持 WAV 等格式,视频支持 MP4。
  • 多种服务提供商兼容:可连接 OpenAI、DeepInfra 等服务生成音频。
  • 自定义配置:支持调整分辨率、语音风格及其他参数。
  • Docker 支持:提供 Docker 镜像,便于本地快速部署。
  • 横竖屏适配:支持生成适合 YouTube Shorts 等平台的竖屏视频。

 

使用帮助

安装流程

TRV 是一个命令行工具,需要一定的技术基础来安装和使用。以下是详细的安装步骤:

1. 前置条件

  • 系统要求:支持 macOS、Linux 或 Windows(需命令行环境)。
  • 依赖工具
    • Git:用于克隆代码仓库。
    • Docker(可选):用于容器化部署。
    • Python(可选):若手动安装部分依赖。
  • 网络连接:部分功能需访问在线服务。

2. 通过 GitHub 获取源码

  1. 打开终端,输入以下命令克隆仓库:
git clone https://github.com/transformrs/trv.git
  1. 进入项目目录:
cd trv

3. 选择安装方式

  • 方式一:使用 Docker(推荐)
  1. 确保 Docker 已安装并运行。
  2. 构建 Docker 镜像:
docker build --rm -t trv .
  1. 运行容器:
docker run -it --rm trv
  1. 在容器内即可使用 TRV 命令。
  • 方式二:手动安装(本地环境)
  1. 安装必要的依赖(如 FFmpeg、Typst 等,具体依赖视系统而定)。
  2. 根据 GitHub 页面说明配置环境变量和工具。
  3. 直接运行 TRV 可执行文件(需编译或下载预构建版本)。

4. 配置服务密钥(可选)

若使用 DeepInfra 或其他在线服务生成音频,需配置 API 密钥:

  1. 获取密钥(如 DeepInfra 的 DEEPINFRA_KEY)。
  2. 在终端设置环境变量:
export DEEPINFRA_KEY="你的密钥"

使用方法

TRV 的核心功能是将幻灯片文件转为视频,以下是具体操作流程:

1. 准备输入文件

  • 创建一个 Typst 格式的演示文件(如 presentation.typ),包含幻灯片内容和演讲笔记。
  • 示例文件内容:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]

2. 生成视频

  • 基本命令
trv --input=presentation.typ --output=out.mp4

这将生成一个默认配置的视频文件 out.mp4

  • 使用在线服务
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav

使用 Kokoros 服务生成 WAV 音频并合成视频。

  • 使用 DeepInfra
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male

需确保已设置 DEEPINFRA_KEY

3. 自定义设置

  • 调整分辨率
    对于竖屏视频(如 YouTube Shorts),可设置:
trv --input=presentation.typ --page=1080x1920
  • 选择语音风格
    指定 --voice 参数,如 american_male 或 bm_lewis,视服务支持而定。

4. 查看输出

  • 生成的视频默认保存在 _out/out.mp4(路径可通过 --output 指定)。
  • 检查日志信息,确保每张幻灯片的音频和视频片段生成无误。

特色功能操作

自动音频生成

  1. 编写演讲笔记,TRV 会根据笔记生成语音。
  2. 通过 --model 指定语音模型(如 tts-1),通过 --voice 选择音色。
  3. 示例:
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis

输出带 bm_lewis 音色的旁白视频。

Docker 本地运行

  1. 在 Docker 容器内运行:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
  1. -v 参数挂载本地目录,确保文件可访问。

竖屏视频制作

  1. 设置页面尺寸为 1080x1920:
trv --input=presentation.typ --page=1080x1920
  1. 输出适合短视频平台的 MP4 文件。

注意事项

  • 文件格式:输入需为 Typst 文件,若不熟悉 Typst,可参考官方文档。
  • 网络依赖:在线服务需稳定网络,建议本地测试时使用 Docker。
  • 硬件要求:如使用高级模型(如 Zyphra Zonos),建议 8GB VRAM 或借助云服务。

通过以上步骤,用户可快速上手 TRV,将幻灯片转化为专业视频,提升内容创作效率。

工具下载
未经允许不得转载:首席AI分享圈 » TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文