はじめに
AI2SRTは、GeminiAI Big Modelを利用し、ワンクリックで短いナレーション付きビデオや長いビデオの要約ビデオを生成し、音声とビデオの書き起こし字幕をサポートするオープンソースプロジェクトです。このプロジェクトは、動画コンテンツ作成プロセスを簡素化し、効率的な字幕生成と翻訳機能を提供することを目的としている。ユーザーは簡単な操作で長い動画を短い動画に変換し、対応する字幕ファイルを生成することができ、教育、娯楽、ビジネスプロモーションなど様々なシーンに適しています。
ウェブインターフェースで設計されたこのツールは、シンプルで直感的に使用でき、Windows、Linux、Macを含む複数のプラットフォームに対応しています。ビデオコンテンツをインテリジェントに理解し、プロフェッショナルなナレーションコピーを生成し、3段階の反映メソッドを使用して高品質の字幕翻訳をサポートするGeminiの強力な機能により、このツールはビデオクリエーターやコンテンツ編集者の強力なアシスタントとなります。として pyVideoTrans マッチングツールを使用。
機能一覧
- 長い動画をワンクリックでAI解説の短い動画を作成する機能
- ビデオ・コンテンツのサマリー・レポートをインテリジェントに生成
- SRT字幕ファイルを翻訳するための3段階の反映方法をサポートする
- オーディオおよびビデオファイルをSRT字幕に自動転記
- ウェブインターフェイス操作、クロスプラットフォームの使用をサポート
- カスタムAIプロンプトワードをサポートし、出力を最適化
- 統合されたGeminiAIインターフェース、gemini-1.5-flashおよび他のモデルをサポートします。
ヘルプの使用
1.環境準備
ai2srtを使い始める前に、以下の条件を確認する必要がある:
- 安定したウェブプロキシ環境(必須)
- GeminiAI APIキー(無料アプリケーションあり)
- 正しいオペレーティング・システムのバージョンを選ぶ
2.インストールと展開
Windowsユーザーへの迅速な導入:
- 最新のパッケージ版をGitHub Releasesページからダウンロードする。
- ダウンロードしたzipファイル(例:window-gemini-video-tools-0.3.7z)を解凍します。
- プログラムを実行するには、"startup.bat "ファイルをダブルクリックします。
- プログラムは自動的にブラウザでオペレータ・インターフェースを開きます: http://127.0.0.1:5030
Linux/Macユーザー向けの導入手順:
- コードリポジトリをクローンする:
git clone https://github.com/jianchang512/ai2srt
- プロジェクト・カタログにアクセスする:
cd ai2srt
- 仮想環境を作成し、起動する:
python3 -m venv venv
ソース/venv/bin/activate
- 依存パッケージをインストールします:
pip3 install -r requirements.txt
- アプリケーションを起動する:
python3 app.py
3.機能的用途の説明
3.1 ビデオナレーションの作成
- 長いビデオファイルをアップロードして、ウェブインターフェースで処理する。
- ナレーションビデオ作成」機能を選択します。
- GeminiAIのパラメータとプロンプトワードを設定する(オプション)
- 処理の開始をクリックし、AIが分析して解説を生成するのを待つ。
- システムはナレーション付きの新しいビデオを自動的に合成する。
3.2 字幕のトランスクリプションと翻訳
- 処理するオーディオおよびビデオファイルのアップロード
- 字幕書き起こし」または「字幕翻訳」機能を選択します。
- 翻訳機能では、翻訳の品質を確保するために3段階の反映プロセスを使用することができる。
- 処理が完了するのを待って、出来上がったSRT字幕ファイルをダウンロードします。
3.3 ビデオの要約生成
- ビデオファイルのアップロード
- ビデオ・サマリー」機能を選択する。
- ビデオコンテンツを分析し、要約レポートを作成するAIを待つ
4.注意事項
- ネットワーク・プロキシが使用中に安定していることを確認してください。
- 無料使用枠の多いgemini-1.5-flashモデルの使用を推奨します。
- AI出力は、キュー・ワードを調整することで最適化できる。
- 処理に失敗した場合は、まずネットワーク・プロキシの状態を確認してください。
- プログラムのバージョンは、最新の機能と最適化で最新の状態に保つ必要があることに注意してください。