Allgemeine Einführung
DiffBIR (Blind Image Restoration with Generative Diffusion Prior) ist ein von der XPixelGroup entwickeltes Werkzeug zur blinden Bildwiederherstellung durch generative Diffusionsmodelle. DiffBIR verwendet ein fortschrittliches generatives Diffusionsmodell, um qualitativ hochwertige wiederhergestellte Bilder zu erzeugen, ohne sich auf ein bestimmtes Degradationsmodell zu verlassen. Das Projekt ist auf GitHub als Open-Source-Projekt verfügbar und bietet detaillierte Anleitungen und vortrainierte Modelle, um die Benutzer bei der Bildwiederherstellung zu unterstützen.
Online-Erfahrung: https://replicate.com/zsxkib/diffbir
Funktionsliste
- Blinde Bild-SuperauflösungVerbessert die Klarheit und Detailgenauigkeit von Bildern mit niedriger Auflösung.
- Wiederherstellung eines blinden GesichtsReparieren Sie qualitativ schlechte oder unscharfe Gesichtsbilder.
- Blinde BildentrauschungEntfernt Rauschen aus einem Bild und verbessert die Bildqualität.
- Generierung von DiffusionsmodellenImage restoration using generative diffusion modeling for multiple degradation scenarios.
- Pre-Training ModellBietet eine Vielzahl von vortrainierten Modellen zur Unterstützung verschiedener Arten von Bildwiederherstellungsaufgaben.
- Online-DemoEine Online-Demo wird zur Verfügung gestellt, damit die Benutzer die Ergebnisse der Bildwiederherstellung direkt erleben können.
Hilfe verwenden
Einbauverfahren
- Klon-Lager::
git clone https://github.com/XPixelGroup/DiffBIR.git
cd DiffBIR
- Installation von Abhängigkeiten::
pip install -r requirements.txt
- Herunterladen des vortrainierten ModellsDownload des trainierten Modells auf
models
finden Sie auf der Projektseite Links zum Herunterladen spezifischer Modelle.
Anweisungen für den Gebrauch
Bild-Restaurierung
- Vorbereiten des Eingabebildes: Legen Sie das zu restaurierende Bild in den
inputs
Katalog. - Ausführen von Inferenzskripten::
python inference.py --input_dir inputs --output_dir outputs
Mit diesem Befehl wird eine Änderung in derinputs
Die Bilder im Verzeichnis werden wiederhergestellt, und die Ergebnisse werden in der Dateioutputs
Katalog.
Modellschulung
- Vorbereiten des Datensatzes: Legen Sie den Trainingsdatensatz in den
data
Katalog, um sicherzustellen, dass das Datenformat den Anforderungen entspricht. - Führen Sie das Trainingsskript aus::
python train_stage1.py --config configs/train_stage1.yaml
python train_stage2.py --config configs/train_stage2.yaml
Mit diesem Befehl werden die erste und zweite Stufe des Trainings nacheinander ausgeführt, um das endgültige Reparaturmodell zu erstellen.
Detaillierte Funktionsabläufe
- Blinde Bild-Superauflösung::
- Das Platzieren eines Bildes mit niedriger Auflösung auf dem
inputs
Katalog. - Führen Sie Inferenzskripte aus, um hochauflösende Bilder zu erzeugen.
- Sonde
outputs
das resultierende Bild im Katalog, um den Reparatureffekt zu bestätigen.
- Das Platzieren eines Bildes mit niedriger Auflösung auf dem
- Wiederherstellung eines blinden Gesichts::
- Das Platzieren eines unscharfen oder qualitativ schlechten Gesichtsbildes auf dem
inputs
Katalog. - Führen Sie das Inferenzskript aus, um das Gesichtsbild zu reparieren.
- Sonde
outputs
das resultierende Bild im Katalog, um den Reparatureffekt zu bestätigen.
- Das Platzieren eines unscharfen oder qualitativ schlechten Gesichtsbildes auf dem
- Blinde Bildentrauschung::
- Das Bild, das das Rauschen enthält, wird in die
inputs
Katalog. - Führen Sie das Inferenzskript aus, um Rauschen aus dem Bild zu entfernen.
- Sonde
outputs
das resultierende Bild im Katalog, um die Wirkung der Rauschunterdrückung zu bestätigen.
- Das Bild, das das Rauschen enthält, wird in die