DiffBIR: Das intelligente Reparaturwerkzeug zur Verbesserung der Bildqualität

Neueste AI-RessourcenAktualisiert vor 7 Monaten AI-Austauschkreis

2.2K 00

Allgemeine Einführung

DiffBIR (Blind Image Restoration with Generative Diffusion Prior) ist ein von der XPixelGroup entwickeltes Werkzeug zur blinden Bildwiederherstellung durch generative Diffusionsmodelle. DiffBIR verwendet ein fortschrittliches generatives Diffusionsmodell, um qualitativ hochwertige wiederhergestellte Bilder zu erzeugen, ohne sich auf ein bestimmtes Degradationsmodell zu verlassen. Das Projekt ist auf GitHub als Open-Source-Projekt verfügbar und bietet detaillierte Anleitungen und vortrainierte Modelle, um die Benutzer bei der Bildwiederherstellung zu unterstützen.

Online-Erfahrung: https://replicate.com/zsxkib/diffbir

Funktionsliste

Blinde Bild-SuperauflösungVerbessert die Klarheit und Detailgenauigkeit von Bildern mit niedriger Auflösung.
Wiederherstellung eines blinden GesichtsReparieren Sie qualitativ schlechte oder unscharfe Gesichtsbilder.
Blinde BildentrauschungEntfernt Rauschen aus einem Bild und verbessert die Bildqualität.
Generierung von DiffusionsmodellenImage restoration using generative diffusion modeling for multiple degradation scenarios.
Pre-Training ModellBietet eine Vielzahl von vortrainierten Modellen zur Unterstützung verschiedener Arten von Bildwiederherstellungsaufgaben.
Online-DemoEine Online-Demo wird zur Verfügung gestellt, damit die Benutzer die Ergebnisse der Bildwiederherstellung direkt erleben können.

Hilfe verwenden

Einbauverfahren

Klon-Lager::

   git clone https://github.com/XPixelGroup/DiffBIR.git
cd DiffBIR

Installation von Abhängigkeiten::

   pip install -r requirements.txt

Herunterladen des vortrainierten ModellsDownload des trainierten Modells aufmodelsfinden Sie auf der Projektseite Links zum Herunterladen spezifischer Modelle.

Anweisungen für den Gebrauch

Bild-Restaurierung

Vorbereiten des Eingabebildes: Legen Sie das zu restaurierende Bild in deninputsKatalog.
Ausführen von Inferenzskripten::

   python inference.py --input_dir inputs --output_dir outputs

Mit diesem Befehl wird eine Änderung in derinputsDie Bilder im Verzeichnis werden wiederhergestellt, und die Ergebnisse werden in der DateioutputsKatalog.

Modellschulung

Vorbereiten des Datensatzes: Legen Sie den Trainingsdatensatz in dendataKatalog, um sicherzustellen, dass das Datenformat den Anforderungen entspricht.
Führen Sie das Trainingsskript aus::

   python train_stage1.py --config configs/train_stage1.yaml
python train_stage2.py --config configs/train_stage2.yaml

Mit diesem Befehl werden die erste und zweite Stufe des Trainings nacheinander ausgeführt, um das endgültige Reparaturmodell zu erstellen.

Detaillierte Funktionsabläufe

Blinde Bild-Superauflösung::
- Das Platzieren eines Bildes mit niedriger Auflösung auf deminputsKatalog.
- Führen Sie Inferenzskripte aus, um hochauflösende Bilder zu erzeugen.
- Sondeoutputsdas resultierende Bild im Katalog, um den Reparatureffekt zu bestätigen.
Wiederherstellung eines blinden Gesichts::
- Das Platzieren eines unscharfen oder qualitativ schlechten Gesichtsbildes auf deminputsKatalog.
- Führen Sie das Inferenzskript aus, um das Gesichtsbild zu reparieren.
- Sondeoutputsdas resultierende Bild im Katalog, um den Reparatureffekt zu bestätigen.
Blinde Bildentrauschung::
- Das Bild, das das Rauschen enthält, wird in dieinputsKatalog.
- Führen Sie das Inferenzskript aus, um Rauschen aus dem Bild zu entfernen.
- Sondeoutputsdas resultierende Bild im Katalog, um die Wirkung der Rauschunterdrückung zu bestätigen.