TRV：スライド/PPTと説明メモからプレゼンテーション動画を高速生成

はじめに

TRVは、GitHubでホストされているオープンソースのツールで、スライドや講義ノートをナレーション付きのビデオに素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画コンテンツを自動的に生成し、プレゼンテーション動画を素早く作成する必要のある教育者、コンテンツ制作者、開発者に適している。transformrsチームによって開発されたこのプロジェクトは、様々な音声生成モデルやフォーマットに対応しており、ローカルへの展開やオンラインサービスを通じて利用することができる。 TRVは効率性と柔軟性を念頭に設計されており、オープンソースであるため、技術愛好家は自由にカスタマイズして機能を拡張することができる。

機能一覧

スライドからビデオへTypst形式のスライドファイルをナレーション付きビデオに変換します。
自動オーディオ生成複数の音声モデルとスタイルをサポートするテキストベースの音声生成。
マルチフォーマット対応出力オーディオはWAVと他のフォーマットをサポートし、ビデオはMP4をサポートします。
複数のサービス・プロバイダーとの互換性OpenAIやDeepInfraなどのサービスと接続し、音声を生成。
カスタム設定解像度、ボイススタイル、その他のパラメーターの調整をサポート。
DockerのサポートDockerイメージは、迅速なローカル展開のために提供されます。
垂直・水平スクリーンの適応YouTube Shortsなどのプラットフォームに適した縦型ビデオの生成に対応。

ヘルプの使用

設置プロセス

TRVはコマンドラインツールであり、インストールと使用には若干の技術的スキルが必要である。以下に詳しいインストール手順を示す：

1.前提条件

システム要件macOS、Linux、Windowsに対応（コマンドライン環境が必要）。
依存ツール::
- Git：コード・リポジトリのクローンに使用される。
- Docker (オプション): コンテナ展開用。
- Python (オプション): 依存関係のいくつかを手動でインストールする場合。
ネットワーク接続機能によっては、オンラインサービスにアクセスする必要があります。

2.GitHub経由でソースコードを入手する

ターミナルを開き、以下のコマンドを入力してリポジトリをクローンする：

git clone https://github.com/transformrs/trv.git

プロジェクト・カタログにアクセスする：

cd trv

3.取り付け方法の選択

方法1：Dockerを使う（推奨）

Dockerがインストールされ、実行されていることを確認する。
Dockerイメージをビルドする：

docker build --rm -t trv .

コンテナを実行する：

docker run -it --rm trv

TRVコマンドはコンテナ内で使用できる。

モード2：手動インストール（ローカル環境）

必要な依存関係（FFmpeg、Typstなど、システムによって異なる）をインストールする。
GitHubページの指示に従って、環境変数とツールを設定する。
TRV実行ファイルを直接実行する（コンパイルまたはビルド済みバージョンのダウンロードが必要）。

4.サービスキーの設定（オプション）

DeepInfraまたは他のオンラインサービスを使用して音声を生成する場合は、APIキーを設定する必要があります：

キーを取得する（例えば、DeepInfraの DEEPINFRA_KEY).
ターミナルで環境変数を設定する：

export DEEPINFRA_KEY="你的密钥"

使用方法

TRVの中心的な機能はスライドファイルを動画に変換することであり、具体的な操作手順は以下の通りである：

1.入力書類の準備

Typst形式のデモファイルを作成する（例 presentation.typ)、スライドの内容とプレゼンテーション・ノートを含む。
ファイルの内容の例：

#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示，欢迎体验 TRV 的自动化功能。]

2.動画生成

基本コマンド::

trv --input=presentation.typ --output=out.mp4

デフォルトの設定でビデオファイルが生成されます。 out.mp4.

オンライン・サービスの利用::

trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav

ココロスのサービスを使って、WAVオーディオを生成し、ビデオを合成する。

DeepInfraの使用::

trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male

を設定したことを確認する必要があります。 DEEPINFRA_KEY.

3.カスタム設定

解像度の調整::
縦画面の動画（YouTube Shortsなど）の場合、設定できます：

trv --input=presentation.typ --page=1080x1920

ボイススタイルの選択::
はっきり確実に示す --voice などのパラメータがある。 american_male もしかしたら bm_lewisサービスサポートによる

4.出力を見る

生成されたビデオはデフォルトで _out/out.mp4(パスは --output (指定）。
各スライドのオーディオクリップとビデオクリップがエラーなく生成されているか、ログメッセージを確認してください。

注目の機能操作

自動オーディオ生成

プレゼン用のメモを書くと、TRVがメモからスピーチを生成する。
とおす --model 発話モデルを指定する（例 tts-1)を通して --voice トーンを選択します。
例

trv --input=presentation.typ --model=tts-1 --voice=bm_lewis

出力帯域 bm_lewis 吹き替えビデオのトーン。

ローカルで動作するDocker

Dockerコンテナ内で実行される：

docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ

-v パラメーターはローカル・ディレクトリーをマウントし、ファイルにアクセスできるようにする。

縦型スクリーン・ビデオ制作

ページサイズを1080x1920に設定する：

trv --input=presentation.typ --page=1080x1920

ショートビデオプラットフォームに適したMP4ファイルを出力する。

ほら

ファイルフォーマット入力はTypstファイルでなければなりません。Typstに詳しくない場合は、公式ドキュメントを参照してください。
ネットワーク依存オンラインサービスには安定したネットワークが必要なので、ローカルテストにはDockerを使うことをお勧めします。
ハードウェア要件上級モデル（Zyphra Zonosなど）を使用する場合は、8GBのVRAMまたはクラウドサービスをお勧めします。

以上の手順で、ユーザーはTRVをすぐに使い始めることができ、スライドをプロフェッショナルなビデオに変換し、コンテンツ作成の効率を向上させることができる。

Hybrid 3D 3.0 - UHDモデリングに対応したTencentの3D生成モデル

最新のAIリソース

6ヶ月前

043.2K

Cloud Document Converter：飞书文档下载插件，飞书云文档转换为本地Markdown格式文档

クラウド文書変換：Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

051.6K

Headshotly：プロのヘッドショットを素早く作成するAIツール

最新のAIリソース # AIイメージスタイルコントロール

11ヶ月前

048.7K

ClearSpeak Browser Plugin: ウェブブラウジングの効率を向上させるAIアシスタント

最新のAIリソース #ブラウザAIアシスタント

11ヶ月前

047.5K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

TRV：スライド/PPTと説明メモからプレゼンテーション動画を高速生成

はじめに

機能一覧

ヘルプの使用

設置プロセス

1.前提条件

2.GitHub経由でソースコードを入手する

3.取り付け方法の選択

4.サービスキーの設定（オプション）

使用方法

1.入力書類の準備

2.動画生成

3.カスタム設定

4.出力を見る

注目の機能操作

自動オーディオ生成

ローカルで動作するDocker

縦型スクリーン・ビデオ制作

ほら

Cardog：自動車情報リサーチと自動車市場データのインテリジェント分析

arXiv論文ビジュアライザー：arXiv論文の推薦と視覚的解釈

関連記事

Hybrid 3D 3.0 - UHDモデリングに対応したTencentの3D生成モデル

クラウド文書変換：Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

Headshotly：プロのヘッドショットを素早く作成するAIツール

ClearSpeak Browser Plugin: ウェブブラウジングの効率を向上させるAIアシスタント

コメントなし

最新コレクション

最新記事

TRV：スライド/PPTと説明メモからプレゼンテーション動画を高速生成

はじめに

機能一覧

ヘルプの使用

設置プロセス

1.前提条件

2.GitHub経由でソースコードを入手する

3.取り付け方法の選択

4.サービスキーの設定（オプション）

使用方法

1.入力書類の準備

2.動画生成

3.カスタム設定

4.出力を見る

注目の機能操作

自動オーディオ生成

ローカルで動作するDocker

縦型スクリーン・ビデオ制作

ほら

Cardog：自動車情報リサーチと自動車市場データのインテリジェント分析

arXiv論文ビジュアライザー：arXiv論文の推薦と視覚的解釈

関連記事

Hybrid 3D 3.0 - UHDモデリングに対応したTencentの3D生成モデル

クラウド文書変換：Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

Headshotly：プロのヘッドショットを素早く作成するAIツール

ClearSpeak Browser Plugin: ウェブブラウジングの効率を向上させるAIアシスタント

コメントなし

厳選されたAIツール

最新コレクション

最新記事