TryOffAnyone: KI-Tool zum Extrahieren von Kleidungsstücken einer Person in Form eines gekachelten Bildes mit Kleidungsstücken

Neueste AI-RessourcenGeschrieben vor 7 Monaten AI-Austauschkreis

1.9K 00

Allgemeine Einführung

TryOffAnyone ist ein bahnbrechendes KI-Bildverarbeitungstool, das entwickelt wurde, um die Herausforderungen bei der Darstellung von Kleidung im E-Commerce-Bereich zu lösen. Es ist in der Lage, Kleidungsfotos von echten Menschen in ihrem Tragezustand intelligent in Bilder mit Lay-Flat-Display-Effekt umzuwandeln, eine Technologie, die auf den neuesten Latent Diffusion Models (LDMs) basiert. Die Kerninnovation des Projekts, das von Forschern entwickelt und veröffentlicht wurde, besteht in der Fähigkeit, Kleidungsbereiche auf dem Foto einer Person genau zu identifizieren und zu extrahieren und sie mit Hilfe eines komplexen KI-Algorithmus in einen professionellen Lay-Flat-Display-Effekt umzuwandeln. Dieser technologische Durchbruch reduziert nicht nur die Kosten für die Erstellung von Produktbildern für E-Commerce-Plattformen erheblich, sondern bietet auch eine bequemere und standardisierte Lösung für die Darstellung von Kleidungsstücken. Das Projekt ist quelloffen auf GitHub, unterstützt die schnelle Bereitstellung und Nutzung in einer Python-Umgebung und bietet eine detaillierte Nutzungsdokumentation und Beispielcode.

Erfahrung: https://huggingface.co/spaces/1aurent/TryOffAnyone

Funktionsliste

Unterstützung von Online-Bild-URL-Direktverarbeitungsfunktionen
Intelligente Erkennung und Extraktion von Bekleidungsbereichen in Bildern
Konvertiert getragene Kleidungsstücke automatisch in einen Flachwäsche-Effekt.
Integrierte professionelle Hintergrundentfernung und Bildoptimierung
Unterstützt Batch-Test-Funktion für VITON-HD-Datensatz
Detaillierte Berechnungen der Modellbewertungsmetriken bereitstellen
Integration mehrerer Methoden zur Bewertung der Bildqualität (SSIM, LPIPS, FID, KID)
Unterstützung für benutzerdefinierte Bildgrößen und Verarbeitungsparameter
Bietet eine schnelle Einsatzmöglichkeit für vortrainierte Modelle
Unterstützt GPU-beschleunigte Verarbeitung

Hilfe verwenden

1. die Konfiguration und Installation der Umgebung

Als Erstes müssen Sie sicherstellen, dass Ihr System die folgenden Anforderungen erfüllt:

Python 3.x Umgebung
CUDA-unterstützte GPUs (empfohlen für beschleunigte Verarbeitung)
Git-Versionskontrollwerkzeuge

Installationsschritte:

# 1. 克隆项目代码
git clone https://github.com/ixarchakos/try-off-anyone.git
cd try-off-anyone
# 2. 安装依赖包
python3 -m pip install -r requirements.txt
# 3. 下载预训练模型
# 访问 https://huggingface.co/ixarchakos/tryOffAnyone
# 将下载的模型文件放置在 "try-off-anyone/ckpt/" 目录下

2. grundlegende Verwendung

2.1 Verarbeitung eines einzelnen Online-Bildes

python3 main.py --inference --url="您的图片URL地址"

Die verarbeiteten Bilder werden in dem Verzeichnis "try-off-anyone/data/" gespeichert.

2.2 Parameter Konfiguration Beschreibung

--seed: Einstellung der Zufallsauswahl (Standard: 36)
--steps: Anzahl der Verarbeitungsschritte (Standard: 50)
--scale: Maßstab (Standard: 2,5)
--width: Breite des Ausgabebildes (Standard: 384)
--height: Höhe des Ausgabebildes (Standard: 512)
--gpu_id: Angabe der GPU-Geräte-ID (Standard: 0)

3. die Nutzung der erweiterten Funktionen

3.1 Stapelverarbeitung von VITON-HD-Datensätzen

VITON-HD Rohdatensatz herunterladen
Laden Sie die Bildmaskendatei für Kleidungsstücke herunter:
- Besuch: https://huggingface.co/ixarchakos/tryOffAnyone/blob/main/masks.zip
- Entpacken Sie sie in das Verzeichnis "try-off-anyone/data/zalando-hd-resized/test/".

Stapelverarbeitung durchführen:

python3 main.py --test

3.2 Bewertung der Qualität

Das System berechnet automatisch die folgenden Indikatoren:

SSIM (strukturelle Ähnlichkeit)
LPIPS (wahrgenommene Ähnlichkeit)
FID (Fréchet Inception Distance)
KID (Kernel Inception Distance)

4) Anmerkungen und Empfehlungen

Für die Eingabe von Bildern wird empfohlen, klare Fotos von der Vorderseite der Kleidung zu verwenden.
Die aktuelle Version unterstützt hauptsächlich die Top-Loading-Verarbeitung
Es wird empfohlen, für die Verarbeitung einen Grafikprozessor zu verwenden, um eine bessere Leistung zu erzielen.
Überwachen Sie die Nutzung der Systemressourcen bei der Verarbeitung einer großen Anzahl von Bildern
Regelmäßige Aktualisierung von Modellen und Abhängigkeitspaketen für beste Ergebnisse

5. die Lösung gemeinsamer Probleme

Wenn Sie CUDA-bezogene Fehler feststellen, überprüfen Sie diese:
- Ist der GPU-Treiber korrekt installiert?
- Stimmt die CUDA-Version mit der PyTorch-Version überein?
Qualitätsprobleme bei der Bildverarbeitung:
- Anpassung des Parameters --steps zum Hinzufügen von Verarbeitungsschritten
- Passen Sie den Parameter - scale an, um den Effekt zu verbessern.
Problem mit unzureichendem Speicher:
- Chargengröße verkleinern
- Größe des Eingabebildes reduzieren