はじめに
TRVは、GitHubでホストされているオープンソースのツールで、スライドや講義ノートをナレーション付きのビデオに素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画コンテンツを自動的に生成し、プレゼンテーション動画を素早く作成する必要のある教育者、コンテンツ制作者、開発者に適している。transformrsチームによって開発されたこのプロジェクトは、様々な音声生成モデルやフォーマットに対応しており、ローカルへの展開やオンラインサービスを通じて利用することができる。 TRVは効率性と柔軟性を念頭に設計されており、オープンソースであるため、技術愛好家は自由にカスタマイズして機能を拡張することができる。
機能一覧
- スライドからビデオへTypst形式のスライドファイルをナレーション付きビデオに変換します。
- 自動オーディオ生成複数の音声モデルとスタイルをサポートするテキストベースの音声生成。
- マルチフォーマット対応出力オーディオはWAVと他のフォーマットをサポートし、ビデオはMP4をサポートします。
- 複数のサービス・プロバイダーとの互換性OpenAIやDeepInfraなどのサービスと接続し、音声を生成。
- カスタム設定解像度、ボイススタイル、その他のパラメーターの調整をサポート。
- DockerのサポートDockerイメージは、迅速なローカル展開のために提供されます。
- 垂直・水平スクリーンの適応YouTube Shortsなどのプラットフォームに適した縦型ビデオの生成に対応。
ヘルプの使用
設置プロセス
TRVはコマンドラインツールであり、インストールと使用には若干の技術的スキルが必要である。以下に詳しいインストール手順を示す:
1.前提条件
- システム要件macOS、Linux、Windowsに対応(コマンドライン環境が必要)。
- 依存ツール::
- Git:コード・リポジトリのクローンに使用される。
- Docker (オプション): コンテナ展開用。
- Python (オプション): 依存関係のいくつかを手動でインストールする場合。
- ネットワーク接続機能によっては、オンラインサービスにアクセスする必要があります。
2.GitHub経由でソースコードを入手する
- ターミナルを開き、以下のコマンドを入力してリポジトリをクローンする:
git clone https://github.com/transformrs/trv.git
- プロジェクト・カタログにアクセスする:
cd trv
3.取り付け方法の選択
- 方法1:Dockerを使う(推奨)
- Dockerがインストールされ、実行されていることを確認する。
- Dockerイメージをビルドする:
docker build --rm -t trv .
- コンテナを実行する:
docker run -it --rm trv
- TRVコマンドはコンテナ内で使用できる。
- モード2:手動インストール(ローカル環境)
- 必要な依存関係(FFmpeg、Typstなど、システムによって異なる)をインストールする。
- GitHubページの指示に従って、環境変数とツールを設定する。
- TRV実行ファイルを直接実行する(コンパイルまたはビルド済みバージョンのダウンロードが必要)。
4.サービスキーの設定(オプション)
DeepInfraまたは他のオンラインサービスを使用して音声を生成する場合は、APIキーを設定する必要があります:
- キーを取得する(例えば、DeepInfraの
DEEPINFRA_KEY
). - ターミナルで環境変数を設定する:
export DEEPINFRA_KEY="你的密钥"
使用方法
TRVの中心的な機能はスライドファイルを動画に変換することであり、具体的な操作手順は以下の通りである:
1.入力書類の準備
- Typst形式のデモファイルを作成する(例
presentation.typ
)、スライドの内容とプレゼンテーション・ノートを含む。 - ファイルの内容の例:
#slide[
#title[欢迎使用 TRV]
这是一个简单的演示。
]
#notes[这是一个简单的演示,欢迎体验 TRV 的自动化功能。]
2.動画生成
- 基本コマンド::
trv --input=presentation.typ --output=out.mp4
デフォルトの設定でビデオファイルが生成されます。 out.mp4
.
- オンライン・サービスの利用::
trv --input=presentation.typ --provider=openai-compatible(kokoros.transformrs.org) --model=tts-1 --voice=bm_lewis --audio-format=wav
ココロスのサービスを使って、WAVオーディオを生成し、ビデオを合成する。
- DeepInfraの使用::
trv --input=presentation.typ --model=Zyphra/Zonos-v0.1-hybrid --voice=american_male
を設定したことを確認する必要があります。 DEEPINFRA_KEY
.
3.カスタム設定
- 解像度の調整::
縦画面の動画(YouTube Shortsなど)の場合、設定できます:
trv --input=presentation.typ --page=1080x1920
- ボイススタイルの選択::
はっきり確実に示す--voice
などのパラメータがある。american_male
もしかしたらbm_lewis
サービスサポートによる
4.出力を見る
- 生成されたビデオはデフォルトで
_out/out.mp4
(パスは--output
(指定)。 - 各スライドのオーディオクリップとビデオクリップがエラーなく生成されているか、ログメッセージを確認してください。
注目の機能操作
自動オーディオ生成
- プレゼン用のメモを書くと、TRVがメモからスピーチを生成する。
- とおす
--model
発話モデルを指定する(例tts-1
)を通して--voice
トーンを選択します。 - 例
trv --input=presentation.typ --model=tts-1 --voice=bm_lewis
出力帯域 bm_lewis
吹き替えビデオのトーン。
ローカルで動作するDocker
- Dockerコンテナ内で実行される:
docker run -it --rm -v $(pwd):/data trv --input=/data/presentation.typ
-v
パラメーターはローカル・ディレクトリーをマウントし、ファイルにアクセスできるようにする。
縦型スクリーン・ビデオ制作
- ページサイズを1080x1920に設定する:
trv --input=presentation.typ --page=1080x1920
- ショートビデオプラットフォームに適したMP4ファイルを出力する。
ほら
- ファイルフォーマット入力はTypstファイルでなければなりません。Typstに詳しくない場合は、公式ドキュメントを参照してください。
- ネットワーク依存オンラインサービスには安定したネットワークが必要なので、ローカルテストにはDockerを使うことをお勧めします。
- ハードウェア要件上級モデル(Zyphra Zonosなど)を使用する場合は、8GBのVRAMまたはクラウドサービスをお勧めします。
以上の手順で、ユーザーはTRVをすぐに使い始めることができ、スライドをプロフェッショナルなビデオに変換し、コンテンツ作成の効率を向上させることができる。