Allgemeine Einführung
Kolors ist ein vom Racer-Team entwickeltes groß angelegtes Modell zur Text-Bild-Erzeugung, das auf Potenzialdiffusionstechniken basiert. Das Modell wurde anhand von Milliarden von Text-Bild-Datenpaaren trainiert und ist in der Lage, qualitativ hochwertige, komplexe, semantisch korrekte Bilder zu erzeugen, wobei sowohl englische als auch chinesische Eingaben unterstützt werden.Kolors weist erhebliche Vorteile bei der visuellen Qualität, der komplexen semantischen Genauigkeit und der Textwiedergabe auf und eignet sich für eine Vielzahl von Anwendungsszenarien, wie z. B. die virtuelle Anprobe, die Bildwiederherstellung und die personalisierte Bilderzeugung.
Funktionsliste
- Text-zu-Bild-GenerierungEingabe von Textbeschreibungen zur Erzeugung hochwertiger Bilder.
- Mehrsprachige UnterstützungUnterstützt chinesische und englische Eingaben, um Bilder in der entsprechenden Sprache zu erzeugen.
- virtuelle AnprobeBietet eine virtuelle Anprobefunktion, mit der Benutzer verschiedene Kleidungsstücke anprobieren können.
- Bild-RestaurierungReparieren und Verfeinern von Bilddetails zur Verbesserung der Bildqualität.
- Personalisierte BilderstellungGenerieren Sie personalisierte Bilder entsprechend den Anforderungen des Benutzers.
- Modelltraining und InferenzBereitstellung von Modelltraining und Inferenzcode zur Erleichterung der Sekundärentwicklung.
Hilfe verwenden
Ablauf der Installation
- Vorbereitung der Umwelt::
- Installieren Sie Python 3.8 oder höher.
- Installieren Sie PyTorch 1.13.1 oder höher.
- Installieren Sie Transformers 4.26.1 oder höher.
- CUDA 11.7 oder höher wird empfohlen.
- Klonen Sie das Repository und installieren Sie die Abhängigkeiten::
apt-get install git-lfs git
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors
conda create --name kolors python=3.8
conda aktivieren kolors
pip install -r anforderungen.txt
python3 setup.py installieren
- Download Modellgewichte::
huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors
Verwendung Prozess
- Text-zu-Bild-Generierung::
- Führen Sie den folgenden Befehl aus, um ein Bild zu erzeugen:
python3 scripts/sample.py "Ein Foto von einem Marienkäfer, Makro, Zoom, hohe Qualität, Film, der ein Schild mit der Aufschrift 'verfügbar' hält"
- Das erzeugte Bild wird in der Datei
scripts/outputs/beispiel_test.jpg
.
- Verwendung von Diffusoren::
- BeratungGebrauchsanweisung für Diffusoren.
- virtuelle Anprobe::
- Besuchen Sie die virtuelle Anprobierseite von Kolors, laden Sie ein Foto hoch und wählen Sie einen Kleidungsstil aus, um zu sehen, was Sie anprobieren können.
- Bild-Restaurierung::
- Mit der Bildreparaturfunktion von Kolors laden Sie das zu reparierende Bild hoch und das System repariert automatisch die Bilddetails.
- Personalisierte Bilderstellung::
- Geben Sie eine Beschreibung Ihrer persönlichen Anforderungen ein, und Kolors erstellt auf der Grundlage der Beschreibung ein konformes Bild.
caveat
- Das Kolors-Modell ist vollständig quelloffen und nur für die akademische Forschung bestimmt. 商业用途需填写问卷并发送至kwai-kolors@kuaishou.com进行注册.
- Bitte halten Sie sich strikt an die Open-Source-Lizenz und vermeiden Sie die Verwendung des Modells für Zwecke, die dem Staat und der Gesellschaft schaden könnten.