CatVTON-FLUX: Kombination von CATVTON- und Flux-Fill-Reparaturmodellen für virtuelle Anpassungsschemata

Neueste AI-RessourcenGeschrieben vor 10 Monaten AI-Austauschkreis

19.2K 00

Allgemeine Einführung

CatVTON-FLUX ist eine fortschrittliche virtuelle Anpasslösung, die CATVTON (Concatenation Is All You Need for Virtual Try-On with Diffusion Models) und Flux Populäre Reparaturmodelle für realistische und genaue Kleidungsstückübertragungen. Das von nftblackmagic entwickelte und von In-Context LoRA for prompt engineering inspirierte Projekt zielt darauf ab, durch den Einsatz von Diffusionsmodellierung und LoRA-Techniken (In-Context LoRA for prompt engineering) eine hochwertige virtuelle Anprobe zu ermöglichen. Die Plattform ermöglicht es den Nutzern, Hugging Face virtuell anzuprobieren und die neuesten Modellgewichte und Leistungsverbesserungen zu erleben.

Online-Erfahrung: https://huggingface.co/spaces/xiaozaa/catvton-flux-try-on

Funktionsliste

Virtuelle Anprobe: Realistische Übertragung von Kleidungsstücken mit CATVTON- und Flux-Modellen.
Unterstützung von LoRA-Gewichten: LoRA-Gewichte werden zur Verbesserung der Modellleistung bereitgestellt.
Gradio Demo: Demonstration der virtuellen Anpassung durch die Gradio-Plattform.
Unterstützung der Umarmungsfläche: Führen Sie CATVTON-FLUX-TRY-ON auf der Umarmungsfläche aus.
Aktualisierung der Modellgewichte: Regelmäßige Aktualisierung der Modellgewichte zur Verbesserung von Leistung und Detailgenauigkeit.

Hilfe verwenden

Einbauverfahren

Stellen Sie sicher, dass die Laufzeitumgebung über >= 40 GB VRAM verfügt (80 GB GPU empfohlen).
Erstellen und aktivieren Sie eine virtuelle Python-Umgebung:

   conda create -n flux python=3.10
conda activate flux

Installieren Sie die erforderlichen Abhängigkeiten:

   pip install -r requirements.txt
huggingface-cli login

Verwendungsprozess

Führen Sie die LoRA-Version der Anpassung aus

Bereiten Sie Eingabebilder, Masken und Bekleidungsbilder vor.
Führen Sie den folgenden Befehl aus, um ihn auszuprobieren:

   python tryon_inference_lora.py \
--image ./example/person/00008_00.jpg \
--mask ./example/person/00008_00_mask.png \
--garment ./example/garment/00034_00.jpg \
--seed 4096 \
--output_tryon test_lora.png \
--steps 30

Eine Testversion ohne LoRA-Version ausführen

Bereiten Sie Eingabebilder, Masken und Bekleidungsbilder vor.
Führen Sie den folgenden Befehl aus, um ihn auszuprobieren:

   python tryon_inference.py \
--image ./example/person/00008_00.jpg \
--mask ./example/person/00008_00_mask.png \
--garment ./example/garment/00034_00.jpg \
--seed 42 \
--output_tryon test.png \
--steps 30

Starten der Gradio-Demo

Führen Sie den folgenden Befehl aus, um die Gradio-Demo mit LoRA-Gewichten zu starten:

   python app.py

Führen Sie den folgenden Befehl aus, um die Gradio-Demo ohne LoRA-Gewichte zu starten:

   python app_no_lora.py

Detaillierte Vorgehensweise

Vorbereiten des EingabebildesVergewissern Sie sich, dass das Eingabebild, die Maske und das Bekleidungsbild die gleiche Größe haben; die empfohlene Größe ist 576x768.
Ausführen des Befehls test-penetrationTry On: Wählen Sie je nach Bedarf die LoRA-Version oder die LoRA-freie Version des Try On-Befehls und passen Sie Parameter wie Seed und Steps für optimale Ergebnisse an.
Ergebnisse anzeigenDie Anpassungsergebnisse werden im angegebenen Ausgabepfad gespeichert, und der Benutzer kann die Anpassungsergebnisse ansehen und auswerten.
Gradio Interface InteraktionÜber die Gradio-Schnittstelle können Nutzer ihre eigenen Bilder und Kleidungsstücke hochladen, um eine virtuelle Anprobe in Echtzeit zu erleben.

Neueste AI-Ressourcen # AI Gesichtstausch und Verkleidung

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Dreamina (d.h. Dream AI): eine KI-Plattform zur Erstellung von Bildern, hergestellt von Shakeology

vor 9 Monaten

030.9K

Wepost: eine KI-Plattform, die die Erstellung und Verwaltung von Inhalten für soziale Medien vereinfacht

Neueste AI-Ressourcen # AI Soziale Medien

vor 8 Monaten

018.5K

Inoreader: Erstellen Sie Ihren eigenen News Feed/RSS Reader/Social Media Monitor

Neueste AI-Ressourcen # AI Offene Dienste

vor 11 Monaten

018.3K

FlashMLA：优化Hopper GPU的MLA解码内核（DeepSeek 开源周第一天）

FlashMLA: Optimierung von MLA-Dekodierungskerneln für Hopper-GPUs (DeepSeek Open Source Week Day 1)

Neueste AI-Ressourcen # AI Java Open Source Projekt

vor 7 Monaten

019.2K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

CatVTON-FLUX: Kombination von CATVTON- und Flux-Fill-Reparaturmodellen für virtuelle Anpassungsschemata

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Verwendungsprozess

Führen Sie die LoRA-Version der Anpassung aus

Eine Testversion ohne LoRA-Version ausführen

Starten der Gradio-Demo

Detaillierte Vorgehensweise

Facetune: Foto- und Videoeditor mit Schwerpunkt Porträtverschönerung, mit vielen Filtern für Porträtdetails (kostenpflichtig)

DH live: KI-Digitalmenschen mit reibungsloser Echtzeit-Interaktion auf Grafikkarten der Serie 30/40

Ähnliche Artikel

Dreamina (d.h. Dream AI): eine KI-Plattform zur Erstellung von Bildern, hergestellt von Shakeology

Wepost: eine KI-Plattform, die die Erstellung und Verwaltung von Inhalten für soziale Medien vereinfacht

Inoreader: Erstellen Sie Ihren eigenen News Feed/RSS Reader/Social Media Monitor

FlashMLA: Optimierung von MLA-Dekodierungskerneln für Hopper-GPUs (DeepSeek Open Source Week Day 1)

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

CatVTON-FLUX: Kombination von CATVTON- und Flux-Fill-Reparaturmodellen für virtuelle Anpassungsschemata

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Verwendungsprozess

Führen Sie die LoRA-Version der Anpassung aus

Eine Testversion ohne LoRA-Version ausführen

Starten der Gradio-Demo

Detaillierte Vorgehensweise

Facetune: Foto- und Videoeditor mit Schwerpunkt Porträtverschönerung, mit vielen Filtern für Porträtdetails (kostenpflichtig)

DH live: KI-Digitalmenschen mit reibungsloser Echtzeit-Interaktion auf Grafikkarten der Serie 30/40

Ähnliche Artikel

Dreamina (d.h. Dream AI): eine KI-Plattform zur Erstellung von Bildern, hergestellt von Shakeology

Wepost: eine KI-Plattform, die die Erstellung und Verwaltung von Inhalten für soziale Medien vereinfacht

Inoreader: Erstellen Sie Ihren eigenen News Feed/RSS Reader/Social Media Monitor

FlashMLA: Optimierung von MLA-Dekodierungskerneln für Hopper-GPUs (DeepSeek Open Source Week Day 1)

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel