AI Personal Learning
und praktische Anleitung

FitDiT: Ein virtuelles Anprobetool mit hoher Wiedergabetreue zur Verbesserung der Authentizität von Kleidungsdetails

Allgemeine Einführung

FitDiT ist ein virtuelles Anprobesystem mit hoher Wiedergabetreue, das auf Diffusionstransformatoren basiert. Das vom Tencent AI Lab entwickelte Projekt zielt darauf ab, die Grenzen herkömmlicher virtueller Anprobesysteme bei der Darstellung von Kleidungsdetails zu überwinden. FitDiT schlägt eine neue algorithmische Architektur vor, die die authentischen Details der Kleidung besser bewahrt und die virtuelle Anprobe realistischer gestaltet. Das Projekt ist vollständig quelloffen und bietet Online-Demos, vortrainierte Modelle und vollständige Code-Implementierungen zur Unterstützung von Forschern und Entwicklern für die akademische Forschung und kommerzielle Vorstudien. Das Projekt veröffentlichte das Papier im November 2024 und öffnete im Dezember 2024 die Online-Demo, den Datensatz und die Modellgewichte, was in der Wissenschaft und der Industrie große Aufmerksamkeit erregte.

FitDiT: Ein virtuelles KI-Anpassungstool zur Verbesserung der Authentizität von Bekleidungsdetails-1

Online-Demo: https://huggingface.co/spaces/BoyuanJiang/FitDiT


 

Funktionsliste

  • Vollständig automatisierte Funktion zur Erzeugung virtueller Anproben
  • Intelligente Maskenerstellung für den Anpassungsbereich
  • Manuelle Maskenanpassung und Bearbeitungswerkzeuge
  • Unterstützung von Anpassungseffekten mit mehreren Auflösungen
  • Optimierung der Detailtreue von Kleidungsstücken
  • Unterstützung einer Online-Präsentationsplattform (Gradio-Schnittstelle)
  • Unterstützung der lokalen Bereitstellung (Unterstützung mehrerer Leistungskonfigurationen)
  • Complex Virtual Dressing Dataset (CVDD) Datensatz
  • Vollständiger Code für Modellschulung und -inferenz
  • Hugging Face Model Hosting Integration

 

Hilfe verwenden

1. online Zugang

FitDiT bietet zwei Möglichkeiten, es online zu nutzen:

  1. Online-Demo des Hugging Face Space: https://huggingface.co/spaces/BoyuanJiang/FitDiT
  2. Offizielle Online-Demoplattform: besuchen Sie http://demo.fitdit.byjiang.com/

Schritte zur Anwendung:

Schritt 1: Erzeugen der Maske für den Anpassungsbereich

  1. Laden Sie ein Bild der Person hoch, deren Kleidung Sie ändern möchten
  2. Laden Sie ein Bild des Kleidungsstücks hoch, das Sie anprobieren möchten
  3. Klicken Sie auf die Schaltfläche "Schritt 1: Maske ausführen", um die erste Maske zu erstellen.
  4. Wenn Sie den Maskenbereich anpassen müssen, können Sie das tun:
    • Verwenden Sie den Schieberegler, um den Maskenbereich einzustellen:
      • mask offset top: passt den oberen Rand an
      • mask offset bottom: passt den unteren Rand an
      • mask offset left: passt den linken Rand an
      • Maskenversatz rechts: passt den rechten Rand an
    • Manuelles Bearbeiten des maskierten Bereichs mit dem Pinselwerkzeug
    • Verwenden Sie das Radiergummi-Werkzeug, um die Kanten der Maske zu verfeinern.

Schritt 2: Erzeugen von Anpassungsergebnissen

  1. Wählen Sie die gewünschte Anpassungsauflösung
  2. Klicken Sie auf "Step2: Run Try-on", um die Generierung zu starten.
  3. Warten Sie, bis die Verarbeitung des Modells abgeschlossen ist, um das Ergebnis der Anpassung zu sehen

2) Methodik für den lokalen Einsatz

Umweltanforderungen:

torch==2.3.0
torchvision==0.18.0
Diffusoren==0.31.0
transformers==4.39.3
gradio==5.8.0
onnxruntime-gpu==1.20.1

Schritte für die Bereitstellung:

  1. Zugang zu FitDiT-Modellgewichten beantragen:
    • Besuchen Sie https://huggingface.co/BoyuanJiang/FitDiT
    • Laden Sie das Modell in den lokalen Katalog herunter, nachdem Sie Zugang erhalten haben.
  2. Führen Sie den lokalen Gradio-Dienst aus:
    Bietet vier Betriebsmodi, die Sie je nach Ihrer Hardwarekonfiguration auswählen können:

    # Schnellster Modus (erfordert größeren Videospeicher):
    python gradio_sd3.py --model_path local_model_dir
    # FP16-Präzisionsmodus:
    python gradio_sd3.py --model_path local_model_dir --fp16
    # CPU-Hilfsmodus (mittlere Geschwindigkeit, mäßiger Videospeicher):
    python gradio_sd3.py --model_path local_model_dir --fp16 --offload
    # Radikaler CPU-Lastmodus (langsamste Geschwindigkeit, geringster Videospeicherverbrauch):
    python gradio_sd3.py --model_path local_model_dir --fp16 --aggressive_offload
    

3 Anweisungen für die Verwendung durch Entwickler

  • Das Projekt steht unter der CC BY-NC-SA-4.0-Lizenz
  • Nur für nicht-kommerzielle Zwecke
  • Für kommerzielle Lizenzen wenden Sie sich bitte an byronjiang@tencent.com.
  • Der vollständige Code für das Modelltraining und der Datensatz sind quelloffen
  • Unterstützt die Verwendung von vortrainierten Modellen über Hugging Face
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " FitDiT: Ein virtuelles Anprobetool mit hoher Wiedergabetreue zur Verbesserung der Authentizität von Kleidungsdetails

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)