はじめに
InstantIRは、InstantXチームによって開発された革新的な単一画像復元モデルで、破損した画像を非常に高品質でリアルな細部まで復元するように設計されており、破損した画像の高品質な復元を可能にします。InstantIRはSDXLとDINOv2モデルを使用し、特定のニーズに合わせてユーザーが設定できる柔軟なパイプラインを提供します。
機能一覧
- 画像修復損傷した画像や低画質の画像を高画質で復元します。
- モデルの生成生成モデリング技術を用いた画像細部の復元
- テキスト・チップ・エディターテキストプロンプトによる画像のカスタマイズ編集。
- フレキシブルな構成様々な画像処理ニーズに対応するため、様々なパラメータ調整に対応。
- ローカル展開Gradioのスクリプトは、ローカルでのデプロイとデモをサポートします。
- 互換性ディフューザーと互換性があり、多くの強力な機能をサポートしています。
ヘルプの使用
設置プロセス
- リポジトリをクローンし、環境をセットアップする::
git clone https://github.com/instantX-research/InstantIR.git cd InstantIR conda create -n instantir python=3.9 -y condaでinstantirをアクティブにする pip install -r requirements.txt
- 訓練済みモデルのダウンロードInstantIRはHuggingFaceからダウンロードできるSDXLとDINOv2モデルに基づいています:
from huggingface_hub import hf_hub_download hf_hub_download(repo_id="stabilityai/stable-diffusion-xl-base-1.0") hf_hub_download(repo_id="facebook/dinov2-large") hf_hub_download(repo_id="InstantX/InstantIR")
- 走り推理使用
infer.sh
推論のためのスクリプト:./infer.sh --sdxl_path --vision_encoder_path --instantir_path --test_path --out_path 。
ヒントとコツ
- 過度のスムージングウィル
--設定
パラメーターは3.0から5.0の間で調整される。 - 低忠実度設定
--プレビュー開始
を0.1~0.4とし、入力の忠実度を保つ。 - 局所歪みウィル
--クリエイティブ・スタート
0.6〜0.8に設定し、ポストで高周波のディテールを生成する。 - 推論の加速改善
--プレビュー開始
以下--クリエイティブ・スタート
計算コストを削減し、推論をスピードアップすることができる。
ディフューザーの使用
InstantIRはディフューザーと完全に互換性があり、直接ロードして使用することができます:
インポートトーチ
from PIL import Image
from diffusers import DDPMScheduler
from schedulers.lcm_single_step_scheduler import LCMSingleStepScheduler
from module.ip_adapter.utils import load_adapter_to_pipe
from pipelines.sdxl_instantir import InstantIRPipeline
# 学習済みモデルをロード
pipe = InstantIRPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', torch_dtype=torch.float16)
load_adapter_to_pipe(pipe, 'facebook/dinov2-large')
pipe.prepare_previewers('path_to_InstantIR')
pipe.scheduler = DDPMScheduler.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', subfolder="scheduler")
lcm_scheduler = LCMSingleStepScheduler.from_config(pipe.scheduler.config)
# 破損した画像を読み込んで修復する
low_quality_image = Image.open('path_to_image').convert("RGB")
image = pipe(image=low_quality_image, previewer_scheduler=lcm_scheduler).images[0].
ローカル・デプロイメント Gradioデモ
Pythonスクリプトは、Gradioデモのローカル展開のために提供されています:
INSTANTIR_PATH= python gradio_demo/app.py
次にブラウザで http://localhost:7860
デモンストレーションを行う。
InstantIR ワンクリックインストーラー
1024の解像度の画像を修復し、メモリは少なくとも24GBビデオメモリは少なくとも16GB、低グラフィックカードは試さないでください。同時に複数の画像を生成した後、メモリの回復が異常です。