Allgemeine Einführung
Kolors ist ein vom Racer-Team entwickeltes groß angelegtes Modell zur Text-Bild-Erzeugung, das auf Potenzialdiffusionstechniken basiert. Das Modell wurde anhand von Milliarden von Text-Bild-Paaren trainiert, unterstützt die Zweisprachigkeit in Englisch und Chinesisch und ist in der Lage, qualitativ hochwertige, komplexe, semantisch korrekte Bilder zu generieren.Kolors hat erhebliche Vorteile bei der visuellen Qualität, der komplexen semantischen Genauigkeit und der Textwiedergabe und eignet sich sowohl für die akademische Forschung als auch für die kommerzielle Nutzung.
Online-Erfahrung:
https://huggingface.co/spaces/Kwai-Kolors/Kolors-Virtual-Try-On
https://modelscope.cn/studios/Kwai-Kolors/Kolors-Virtual-Try-On
https://virtual-try-on.online/zh/playground
Funktionsliste
- Text-zu-Bild-Generierung: Geben Sie Textbeschreibungen ein, um entsprechende hochwertige Bilder zu generieren.
- Virtuelle Anprobe: Laden Sie Bilder von Porträts und Kleidung hoch, um realistische virtuelle Anprobeeffekte zu erzeugen.
- Unterstützung mehrerer Modelle: einschließlich ControlNet, IP-Adapter, LoRA, usw.
- Offener Quellcode: Zur Unterstützung der akademischen Forschung und kommerzieller Anwendungen wird ein vollständiger Trainings- und Inferenzcode bereitgestellt.
- Multiplattform-Kompatibilität: unterstützt Diffuser, ComfyUI und andere Plattformen.
Hilfe verwenden
Ablauf der Installation
- Vorbereitung der UmweltVergewissern Sie sich, dass Python 3.8 und höher installiert ist und dass die erforderlichen Bibliotheken installiert sind.
pip install -r anforderungen.txt
- Modelle herunterladen: VonGitHubvielleichtGesicht umarmenDownload Kolors Modellgewichte.
- Konfiguration der Umgebung: Konfigurieren Sie die Umgebungsvariablen und Pfade gemäß den Richtlinien in der README-Datei.
Richtlinien für die Verwendung
- Text-zu-Bild-Generierung::
- Führen Sie den folgenden Befehl aus und geben Sie eine Textbeschreibung ein, um ein Bild zu erzeugen:
python generate.py --text "Ein Hund, der im Gras läuft."
- Das erzeugte Bild wird in dem angegebenen Verzeichnis gespeichert.
- Führen Sie den folgenden Befehl aus und geben Sie eine Textbeschreibung ein, um ein Bild zu erzeugen:
- virtuelle Anprobe::
- Hochladen von Porträt- und Bekleidungsbildern:
python virtual_try_on.py --person_image "person.jpg" --kleidung_bild "kleidung.jpg"
- Die erzeugten virtuellen Anpassungsergebnisse werden in dem angegebenen Verzeichnis gespeichert.
- Hochladen von Porträt- und Bekleidungsbildern:
- Modellschulung::
- Verwenden Sie den folgenden Befehl, um das Training zu starten:
python train.py --config "config.yaml"
- Passen Sie die Parameter in der Konfigurationsdatei, wie z. B. die Lernrate, die Stapelgröße usw., nach Bedarf an.
- Verwenden Sie den folgenden Befehl, um das Training zu starten:
- Multiplattform-Kompatibilität::
- Verwenden Sie Kolors in Diffusoren:
von Auslässe importieren DiffusionPipeline pipeline = DiffusionPipeline.from_pretrained("Kwai-Kolors/Kolors") image = pipeline("Ein Hund, der im Gras läuft.").images[0] image.save("output.png")
- Verwendung von Kolors in ComfyUI:
von comfyui importieren ComfyUI ui = ComfyUI(model="Kwai-Kolors/Kolors") ui.generate("Ein Hund, der im Gras läuft.", output="output.png")
- Verwenden Sie Kolors in Diffusoren:
allgemeine Probleme
- Wie lässt sich die Qualität der erzeugten Bilder verbessern?
- Anpassung der Modellparameter, z. B. Erhöhung der Trainingsdatenmenge, Optimierung der Lernrate usw.
- Was ist, wenn die virtuelle Anprobe nicht funktioniert?
- Stellen Sie sicher, dass die hochgeladenen Bilder klar und gut beleuchtet sind, und passen Sie die Winkel und Proportionen der Kleidungsbilder an.
- Dauert die Modellausbildung zu lange?
- Verwenden Sie Hochleistungs-GPUs für das Training oder wählen Sie eine Cloud-Computing-Plattform, um den Trainingsprozess zu beschleunigen.