はじめに
DiffBIR (Blind Image Restoration with Generative Diffusion Prior) はXPixelGroupによって開発された画像復元ツールで、生成拡散モデルによるブラインド画像復元を目的としています。このツールは、画像の超解像、画像ノイズ除去、顔復元など、様々な画像劣化問題を扱うことができます。DiffBIRは、特定の劣化モデルに依存することなく高品質な復元画像を生成するために、高度な生成拡散モデルを使用しています。このプロジェクトはGitHub上でオープンソース化されており、画像復元タスクにおいてユーザーを容易にするために、詳細な説明と事前に学習されたモデルを提供しています。
機能一覧
- ブラインド画像超解像低解像度の画像の鮮明さとディテールを向上させます。
- ブラインド顔面修復低画質やぼやけた顔画像を修復します。
- ブラインド画像ノイズ除去画像からノイズを除去し、画質を向上させます。
- 拡散モデルの生成複数の劣化シナリオに対する生成拡散モデリングを用いた画像復元。
- 事前学習モデル様々な種類の画像復元タスクをサポートするために、事前に訓練された様々なモデルを提供します。
- オンラインデモオンラインデモは、ユーザーが直接画像の復元結果を体験できるように提供されています。
ヘルプの使用
設置プロセス
- クローン倉庫::
git clone https://github.com/XPixelGroup/DiffBIR.git
cd DiffBIR
- 依存関係のインストール::
pip install -r requirements.txt
- 訓練済みモデルのダウンロード学習済みモデルを
モデル
ディレクトリにある特定のモデルのダウンロード・リンクについては、プロジェクト・ページを参照してください。
使用方法
画像修復
- 入力画像の準備復元する画像を
インプット
カタログ - 推論スクリプトの実行::
python inference.py --input_dir inputs --output_dir outputs
このコマンドはインプット
ディレクトリ内の画像がリストアされ、その結果がアウトプット
カタログ
モデルトレーニング
- データセットの準備トレーニングデータセットを
データ
カタログを参照し、データ形式が要件を満たしていることを確認する。 - トレーニングスクリプトの実行::
python train_stage1.py --configs/train_stage1.yaml
python train_stage2.py --configs/train_stage2.yaml
このコマンドは、第1段階と第2段階のトレーニングを順次実行し、最終的な修復モデルを生成する。
詳細な機能操作の流れ
- ブラインド画像超解像::
- 低解像度の画像を
インプット
カタログ - 推論スクリプトを実行し、高解像度の画像を生成する。
- プローブ
アウトプット
をクリックし、カタログに掲載された画像で修復効果を確認する。
- 低解像度の画像を
- ブラインド顔面修復::
- 不鮮明または低画質の顔画像を
インプット
カタログ - 推論スクリプトを実行して顔画像を修復する。
- プローブ
アウトプット
をクリックし、カタログに掲載された画像で修復効果を確認する。
- 不鮮明または低画質の顔画像を
- ブラインド画像ノイズ除去::
- ノイズを含む画像は
インプット
カタログ - 推論スクリプトを実行し、画像からノイズを除去する。
- プローブ
アウトプット
その結果得られた画像をカタログに掲載し、ノイズ除去効果を確認した。
- ノイズを含む画像は