Allgemeine Einführung
DiffBIR (Blind Image Restoration with Generative Diffusion Prior) ist ein von der XPixelGroup entwickeltes Werkzeug zur blinden Bildwiederherstellung durch generative Diffusionsmodelle. DiffBIR verwendet ein fortschrittliches generatives Diffusionsmodell, um qualitativ hochwertige wiederhergestellte Bilder zu erzeugen, ohne sich auf ein bestimmtes Degradationsmodell zu verlassen. Das Projekt ist auf GitHub als Open-Source-Projekt verfügbar und bietet detaillierte Anleitungen und vortrainierte Modelle, um die Benutzer bei der Bildwiederherstellung zu unterstützen.
Online-Erfahrung: https://replicate.com/zsxkib/diffbir
Funktionsliste
- Blinde Bild-SuperauflösungVerbessert die Klarheit und Detailgenauigkeit von Bildern mit niedriger Auflösung.
- Wiederherstellung eines blinden GesichtsReparieren Sie qualitativ schlechte oder unscharfe Gesichtsbilder.
- Blinde BildentrauschungEntfernt Rauschen aus einem Bild und verbessert die Bildqualität.
- Generierung von DiffusionsmodellenImage restoration using generative diffusion modelling for multiple degradation scenarios.
- Pre-Training ModellBietet eine Vielzahl von vortrainierten Modellen zur Unterstützung verschiedener Arten von Bildwiederherstellungsaufgaben.
- Online-DemoEine Online-Demo wird zur Verfügung gestellt, damit die Benutzer die Ergebnisse der Bildwiederherstellung direkt erleben können.
Hilfe verwenden
Ablauf der Installation
- Klon-Lager::
git clone https://github.com/XPixelGroup/DiffBIR.git
cd DiffBIR
- Installation von Abhängigkeiten::
pip install -r anforderungen.txt
- Download des vortrainierten ModellsDownload des trainierten Modells auf
Modelle
finden Sie auf der Projektseite Links zum Herunterladen spezifischer Modelle.
Anweisungen für den Gebrauch
Bild-Restaurierung
- Vorbereiten des Eingabebildes: Legen Sie das zu restaurierende Bild in den
Eingaben
Katalog. - Ausführen von Inferenzskripten::
python inference.py --input_dir inputs --output_dir outputs
Mit diesem Befehl wird eine Änderung in derEingaben
Die Bilder im Verzeichnis werden wiederhergestellt, und die Ergebnisse werden in der DateiAusgänge
Katalog.
Modellschulung
- Vorbereiten des Datensatzes: Legen Sie den Trainingsdatensatz in den
Daten
Katalog, um sicherzustellen, dass das Datenformat den Anforderungen entspricht. - Führen Sie das Trainingsskript aus::
python train_stage1.py --config configs/train_stage1.yaml
python train_stage2.py --config configs/train_stage2.yaml
Mit diesem Befehl werden die erste und zweite Stufe des Trainings nacheinander ausgeführt, um das endgültige Reparaturmodell zu erstellen.
Detaillierte Funktionsabläufe
- Blinde Bild-Superauflösung::
- Das Platzieren eines Bildes mit niedriger Auflösung auf dem
Eingaben
Katalog. - Führen Sie Inferenzskripte aus, um hochauflösende Bilder zu erzeugen.
- Sonde
Ausgänge
das resultierende Bild im Katalog, um den Reparatureffekt zu bestätigen.
- Das Platzieren eines Bildes mit niedriger Auflösung auf dem
- Wiederherstellung eines blinden Gesichts::
- Das Platzieren eines unscharfen oder qualitativ schlechten Gesichtsbildes auf dem
Eingaben
Katalog. - Führen Sie das Inferenzskript aus, um das Gesichtsbild zu reparieren.
- Sonde
Ausgänge
das resultierende Bild im Katalog, um den Reparatureffekt zu bestätigen.
- Das Platzieren eines unscharfen oder qualitativ schlechten Gesichtsbildes auf dem
- Blinde Bildentrauschung::
- Das Bild, das das Rauschen enthält, wird in die
Eingaben
Katalog. - Führen Sie das Inferenzskript aus, um Rauschen aus dem Bild zu entfernen.
- Sonde
Ausgänge
das resultierende Bild im Katalog, um die Wirkung der Rauschunterdrückung zu bestätigen.
- Das Bild, das das Rauschen enthält, wird in die