Allgemeine Einführung
InstantIR ist ein innovatives Einzelbild-Restaurationsmodell, das vom InstantX-Team entwickelt wurde, um Ihre beschädigten Bilder mit extrem hoher Qualität und naturgetreuen Details wiederherzustellen. Das Tool stellt nicht nur Bilddetails wieder her, sondern verbessert auch die Genauigkeit des wiederhergestellten Bildes durch zusätzliche Texteinblendungen. InstantIR verwendet SDXL- und DINOv2-Modelle und bietet eine flexible Pipeline von Konfigurationen, die vom Benutzer an seine spezifischen Bedürfnisse angepasst werden können.
Funktionsliste
- Bild-RestaurierungHochwertige Restaurierung beschädigter oder minderwertiger Bilder.
- Modelle generierenImage detail recovery using generative modeling techniques.
- Text-Tipp-EditorBenutzerdefinierte Bearbeitung von Bildern mit Hilfe von Texteingabeaufforderungen.
- Flexible KonfigurationUnterstützt eine Vielzahl von Parametereinstellungen, um unterschiedlichen Bildverarbeitungsanforderungen gerecht zu werden.
- lokaler EinsatzGradio-Skripte werden zur Verfügung gestellt, um den lokalen Einsatz und Demos zu unterstützen.
- Kompatibilität: Kompatibel mit Diffusoren und unterstützt viele leistungsstarke Funktionen.
Hilfe verwenden
Ablauf der Installation
- Klonen des Repositorys und Einrichten der Umgebung::
git clone https://github.com/instantX-research/InstantIR.git cd InstantIR conda create -n instantir python=3.9 -y conda instantir aktivieren pip install -r anforderungen.txt
- Download des vortrainierten ModellsInstantIR basiert auf den Modellen SDXL und DINOv2, die von HuggingFace heruntergeladen werden können:
from huggingface_hub import hf_hub_download hf_hub_download(repo_id="stabilityai/stable-diffusion-xl-base-1.0") hf_hub_download(repo_id="facebook/dinov2-large") hf_hub_download(repo_id="InstantX/InstantIR")
- logische Schlussfolgerungen: Verwendung
infer.sh
Skripte für die Argumentation:. /infer.sh --sdxl_pfad --vision_encoder_pfad --instantir_pfad --test_pfad --out_path
Tipps & Tricks
- übermäßige Glättung: Wille
--cfg
Der Parameter wird zwischen 3,0 und 5,0 eingestellt. - geringe Wiedergabetreue: Einstellungen
--preview_start
beträgt 0,1 bis 0,4, um die Eingabetreue zu erhalten. - lokale Verzerrung: Wille
--kreativ_start
Setzen Sie diesen Wert auf 0,6 bis 0,8, um in der Nachbearbeitung Details mit hohen Frequenzen zu erzeugen. - Beschleunigte Argumentation: Verbesserung
--preview_start
und niedriger--kreativ_start
Dadurch können die Rechenkosten gesenkt und die Argumentation beschleunigt werden.
Verwendung von Diffusoren
InstantIR ist vollständig kompatibel mit Diffusoren und kann direkt geladen und verwendet werden:
Brenner importieren
von PIL importieren Bild
from diffusers import DDPMScheduler
from schedulers.lcm_single_step_scheduler import LCMSingleStepScheduler
from module.ip_adapter.utils import load_adapter_to_pipe
von pipelines.sdxl_instantir importieren InstantIRPipeline
# Laden Sie das vortrainierte Modell
pipe = InstantIRPipeline.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', torch_dtype=torch.float16)
load_adapter_to_pipe(pipe, 'facebook/dinov2-large')
pipe.prepare_previewers('path_to_InstantIR')
pipe.scheduler = DDPMScheduler.from_pretrained('stabilityai/stable-diffusion-xl-base-1.0', subfolder="scheduler")
lcm_scheduler = LCMSingleStepScheduler.from_config(pipe.scheduler.config)
# Laden Sie das beschädigte Bild und reparieren Sie es
low_quality_image = Image.open('path_to_image').convert("RGB")
image = pipe(image=low_quality_image, previewer_scheduler=lcm_scheduler).images[0]
Lokale Bereitstellung Gradio Demo
Für die lokale Bereitstellung der Gradio-Demo wird ein Python-Skript bereitgestellt:
INSTANTIR_PATH= python gradio_demo/app.py
Besuchen Sie dann in Ihrem Browser http://localhost:7860
Führen Sie eine Demonstration durch.
InstantIR Ein-Klick-Installer
Reparatur 1024 Auflösung Bilder, Speicher mindestens 24gb Videospeicher mindestens 16gb, niedrige Grafikkarte nicht versuchen. Nach der Erzeugung mehrerer Bilder zur gleichen Zeit, ist die Speicherwiederherstellung abnormal.