InstantIR：破損した画像の修復と画像の高解像度ズームのオープンソースプロジェクト、最低16Gのビデオメモリ

2.3K 00

はじめに

InstantIRは、InstantXチームによって開発された革新的な単一画像復元モデルで、破損した画像を非常に高品質でリアルな細部まで復元するように設計されており、破損した画像の高品質な復元を可能にします。InstantIRはSDXLとDINOv2モデルを使用し、特定のニーズに合わせてユーザーが設定できる柔軟なパイプラインを提供します。

オンライン経験：https://huggingface.co/InstantX/InstantIR

インスタントIRの設定

機能一覧

画像修復損傷した画像や低画質の画像を高画質で復元します。
モデルの生成生成モデリング技術を用いた画像細部の復元
テキスト・チップ・エディターテキストプロンプトによる画像のカスタマイズ編集。
フレキシブルな構成様々な画像処理ニーズに対応するため、様々なパラメータ調整に対応。
ローカル展開Gradioのスクリプトは、ローカルでのデプロイとデモをサポートします。
互換性ディフューザーと互換性があり、多くの強力な機能をサポートしています。

ヘルプの使用

設置プロセス

リポジトリをクローンし、環境をセットアップする::

git clone https://github.com/instantX-research/InstantIR.git
cd InstantIR
conda create -n instantir python=3.9 -y
conda activate instantir
pip install -r requirements.txt

訓練済みモデルのダウンロードInstantIRはHuggingFaceからダウンロードできるSDXLとDINOv2モデルに基づいています：

from huggingface_hub import hf_hub_download
hf_hub_download(repo_id="stabilityai/stable-diffusion-xl-base-1.0")
hf_hub_download(repo_id="facebook/dinov2-large")
hf_hub_download(repo_id="InstantX/InstantIR")

走り推理使用 infer.sh 推論のためのスクリプト：

./infer.sh --sdxl_path <path_to_SDXL> --vision_encoder_path <path_to_DINOv2> --instantir_path <path_to_InstantIR> --test_path <path_to_input> --out_path <path_to_output>

ヒントとコツ

過度のスムージングウィル --cfg パラメーターは3.0から5.0の間で調整される。
低忠実度設定 --preview_start を0.1～0.4とし、入力の忠実度を保つ。
局所歪みウィル --creative_start 0.6〜0.8に設定し、ポストで高周波のディテールを生成する。
推論の加速改善 --preview_start 以下 --creative_start 計算コストを削減し、推論をスピードアップすることができる。

ディフューザーの使用

InstantIRはディフューザーと完全に互換性があり、直接ロードして使用することができます：

import torch
from PIL import Image
from diffusers import DDPMScheduler
from schedulers.lcm_single_step_scheduler import LCMSingleStepScheduler
from module.ip_adapter.utils import load_adapter_to_pipe
from pipelines.sdxl_instantir import InstantIRPipeline
# 加载预训练模型
pipe = InstantIRPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', torch_dtype=torch.float16)
load_adapter_to_pipe(pipe, 'facebook/dinov2-large')
pipe.prepare_previewers('path_to_InstantIR')
pipe.scheduler = DDPMScheduler.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', subfolder="scheduler")
lcm_scheduler = LCMSingleStepScheduler.from_config(pipe.scheduler.config)
# 加载损坏图像并进行修复
low_quality_image = Image.open('path_to_image').convert("RGB")
image = pipe(image=low_quality_image, previewer_scheduler=lcm_scheduler).images[0]

ローカル・デプロイメント Gradioデモ

Pythonスクリプトは、Gradioデモのローカル展開のために提供されています：

INSTANTIR_PATH=<path_to_InstantIR> python gradio_demo/app.py

次にブラウザで http://localhost:7860 デモンストレーションを行う。

InstantIR ワンクリックインストーラー

1024の解像度の画像を修復し、メモリは少なくとも24GBビデオメモリは少なくとも16GB、低グラフィックカードは試さないでください。同時に複数の画像を生成した後、メモリの回復が異常です。

Baidu.comダウンロード

Quark.comをダウンロード

Thunderboltダウンロード

この記事は著作権で保護されており、許可なく複製することは禁じられている。

Unify：潜在的な買い手データを効率的に分析するAI搭載のGTMツール

最新のAIリソース # AIマーケティング

5ヶ月前

01.5K

バイトホッパーがAI音楽生成モデル「Seed-Music」を発表

最新のAIリソース

2ヶ月前

0636

Executive AI Assistant：AI行政助理，提醒阅读邮件并规划工作日程

エグゼクティブAIアシスタント：AIエグゼクティブアシスタント、電子メールを読むためのリマインダー、仕事のスケジュールを計画する

7ヶ月前

01.7K

Agentic Workers：在ChatGPT中自动执行多轮问答并获得最终答案

エージェント型ワーカー：ChatGPTで複数回のQ&Aを自動化し、最終的な回答を得る

最新のAIリソース # PROMPTS エイド

6ヶ月前

0978

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

InstantIR：破損した画像の修復と画像の高解像度ズームのオープンソースプロジェクト、最低16Gのビデオメモリ

機能一覧

ヘルプの使用

設置プロセス

ヒントとコツ

ディフューザーの使用

ローカル・デプロイメント Gradioデモ

InstantIR ワンクリックインストーラー

Beanbag MarsCode: Beanbag Big Modelに基づいたAIプログラミング・アシスタント。

Qwen2.5-Coderフルシリーズ：パワフル、多機能、実用的。

関連記事

Unify：潜在的な買い手データを効率的に分析するAI搭載のGTMツール

バイトホッパーがAI音楽生成モデル「Seed-Music」を発表

エグゼクティブAIアシスタント：AIエグゼクティブアシスタント、電子メールを読むためのリマインダー、仕事のスケジュールを計画する

エージェント型ワーカー：ChatGPTで複数回のQ&Aを自動化し、最終的な回答を得る

コメントなし

最新コレクション

最新記事

InstantIR：破損した画像の修復と画像の高解像度ズームのオープンソースプロジェクト、最低16Gのビデオメモリ

機能一覧

ヘルプの使用

設置プロセス

ヒントとコツ

ディフューザーの使用

ローカル・デプロイメント Gradioデモ

InstantIR ワンクリックインストーラー

Beanbag MarsCode: Beanbag Big Modelに基づいたAIプログラミング・アシスタント。

Qwen2.5-Coderフルシリーズ：パワフル、多機能、実用的。

関連記事

Unify：潜在的な買い手データを効率的に分析するAI搭載のGTMツール

バイトホッパーがAI音楽生成モデル「Seed-Music」を発表

エグゼクティブAIアシスタント：AIエグゼクティブアシスタント、電子メールを読むためのリマインダー、仕事のスケジュールを計画する

エージェント型ワーカー：ChatGPTで複数回のQ&Aを自動化し、最終的な回答を得る

コメントなし

厳選されたAIツール

最新コレクション

最新記事