はじめに
ビデオ字幕リムーバー(Video-subtitle-remover、略してVSR)は、AI技術に基づいたビデオ処理ソフトウェアで、ビデオからハード字幕やテキストウォーターマークを削除するために特別に設計されています。このツールは、様々なAIアルゴリズムモデル(STTN、LAMA、PROPAINTER)を使用して、動画から字幕テキストをインテリジェントに識別し、非破壊で削除すると同時に、ディープラーニング技術を通じて、字幕を削除した後の領域をインテリジェントに埋めて修復します。このソフトウェアはWindows、macOS、Linuxをサポートし、グラフィカルインターフェースとコマンドライン操作の両方を提供します。VSRは指定された位置の字幕を処理するだけでなく、ビデオ全体のテキストを自動的に検出して削除し、画像内の透かしテキストのバッチ処理をサポートします。このツールは、ハードコードされた字幕を含むビデオクリップを処理する必要があるコンテンツ制作者やビデオ編集者に特に適しています。
一般的なソフトは透かしをぼかすことしかできないが、それは非常に不自然に見える。VSRは透かしを隠すために画像の小片を生成し、この画像の小片はAIによって描かれ、周囲の画像のアーティキュレーションは非常に自然である。最終的な結果は素晴らしいと言える!
VSRの長所:ビデオウォーターマークと埋め込まれた字幕を非常によく除去する。 短所:動く透かしは削除できない。ソフトウェアのサイズが大きい。
VSRのヒント:いくつかの透かしは、ビデオの背景色に近い、除去効果が良くないです、あなたはクリッピングを使用して、元の透かしの上に高コントラストの透かしを追加し、それを削除するためにVSRを使用することができます、効果は非常に良いでしょう。
機能一覧
- ロスレス解像度はビデオからハードな字幕を取り除き、オリジナルのビデオ品質を維持します。
- 複数のAIアルゴリズムモデル(STTN、LAMA、PROPAINTER)をサポートし、インテリジェントな字幕領域復元を実現。
- カスタム字幕位置のターゲット削除をサポート
- 完全なビデオ自動検出とすべてのテキストコンテンツの削除をサポート
- 画像一括透かしテキスト削除機能の提供
- クロスプラットフォーム対応(Windows/macOS/Linux)
- グラフィカル・インターフェース(GUI)とコマンドライン(CLI)の2つの操作モードを提供。
- カスタマイズされた処理パラメータをサポートし、エフェクトの除去は要件に応じて調整することができます。
- GPUによる高速処理をサポートし、処理効率を向上
ヘルプの使用
インストールの準備
- システム要件
- Nvidia製グラフィックカードを搭載していること(最小構成:GTX 1060以上)
- CPUはAVX命令セットをサポートする必要がある
- Python 3.8+ ランタイム環境
- ソフトウェアを入手する:
- 方法1:パッケージ版を直接ダウンロードする(初心者におすすめ)
- Windows GPU バージョン v1.1.0 ダウンロード:
- 方法2:ソースコードのインストール(開発者向け)
- GitHubリポジトリコードのクローンまたはダウンロード
- 指示に従って開発環境を設定する
- 方法1:パッケージ版を直接ダウンロードする(初心者におすすめ)
操作方法
- パッケージ版は動作する:
- ダウンロードしたzipファイルを解凍する
- プログラムを直接実行して使用する
- ソースコードのバージョンは実行される:
- Pythonの仮想環境を作る:
conda create -n videoEnv python=3.8 conda activate videoEnv
- CUDAとcuDNNのインストール(オペレーティングシステムに応じて、対応するインストール方法を選択する)
- 依存関係をインストールします:
pip install -r requirements.txt
- プログラムを実行する:
- グラフィカル・インターフェースのバージョン:
python gui.py
- コマンドライン版:
python ./バックエンド/main.py
- グラフィカル・インターフェースのバージョン:
- Pythonの仮想環境を作る:
ヒントとコツ
- パフォーマンスの最適化:
処理が遅い場合は、backend/config.pyのパラメータを変更することで速度を上げることができます:MODE = InpaintMode.STTN # STTN アルゴリズムを使う STTN_SKIP_DETECTION = True # 速度を上げるために字幕検出をスキップする
- 効果の最適化:
ビデオの種類によって異なるアルゴリズムを選択することができる:- STTNアルゴリズム:実写映像に適しており、処理速度が速い。
- LAMAアルゴリズム: アニメーションビデオや画像処理に最適
- PROPAINTERアルゴリズム:激しい動きのあるビデオに適しています。
- パラメータ調整:
以下のパラメーターを調整することで、処理を改善することができる:# STTNアルゴリズムパラメータ STTN_NEIGHBOR_STRIDE = 10 # 近隣フレーム数 STTN_REFERENCE_LENGTH = 10 # 参照フレーム長 STTN_MAX_LOAD_NUM = 30 # 最大処理フレーム数
- よくある質問にも答えている:
- CondaHTTPErrorが発生した場合は、設定ファイルを参照して
- CUDA11.8は、4090グラフィックカードユーザーに推奨されます。
- 7z解凍の問題は、解凍ソフトウェアを最新バージョンにアップグレードする必要があります。
警告だ:
- NVIDIAグラフィックカードが必要です。AMDグラフィックカードはサポートされていません。
- 処理効果はグラフィックカードの性能に関係し、構成が高いほど効果は高くなる
- 異なるアルゴリズムは異なるシナリオに適しており、ビデオのタイプに応じて選択することをお勧めします。
- カスタマイズされたモデルについては、デザインフォルダのトレーニング方法を参照してください。
VSR Quark ダウンロードアドレス