Allgemeine Einführung
UltraPixel ist eine fortschrittliche Technologie zur Erzeugung von Bildern mit ultrahoher Auflösung, mit der extrem hochwertige und detaillierte Bilder erzeugt werden können. UltraPixel wurde vom GitHub-Benutzer catcathh entwickelt und auf der NeurIPS 2024 vorgestellt. Es unterstützt die Erzeugung von Bildern mit einer Auflösung von 1K bis 6K, wobei die Ergebnisse mit denen des MidJourney und DALL-E 3, wodurch die Qualität und Detailgenauigkeit der Bilderzeugung erheblich verbessert wurde.

Online-Erfahrung: https://huggingface.co/spaces/roubaofeipi/UltraPixel-demo
- Erzeugung hochauflösender Bilder Unterstützt die Bilderzeugung bei jeder Auflösung von 1K bis 6K.
- Unterstützung mehrerer Modelle Eine Vielzahl von Vorübungsmodellen wird zur Verfügung gestellt, so dass der Benutzer das passende Modell für seine Bedürfnisse auswählen kann.
- Textgesteuerte Bilderzeugung Generieren Sie qualitativ hochwertige Bilder mit detaillierten Textbeschreibungen.
- Gradio-Schnittstelle Gradio: Bietet eine Gradio-Schnittstelle zur Erleichterung von Bilderzeugungsvorgängen.
- Effiziente Speicherverwaltung Unterstützung der Kachel-Dekodierung, um Speicherressourcen zu sparen.
Hilfe verwenden
Einbauverfahren
- Installation von Abhängigkeiten : Führen Sie den folgenden Befehl aus, um die erforderlichen Abhängigkeiten zu installieren:
pip install -r requirements.txt
- Herunterladen des vortrainierten Modells : Laden Sie das vortrainierte Modell gemäß dem Link in der README-Datei herunter und legen Sie es in die Datei
models
Katalog. - UltraPixel-Spezifikationen herunterladen : Laden Sie die neuen Parameter für UltraPixel von dem angegebenen Link herunter und fügen Sie sie in den Ordner
models
Katalog. - durch (eine Lücke)hier (literarisch)Laden Sie die neuen Parameter für UltraPixel herunter.
- Modellliste:https://github.com/catcathh/UltraPixel/blob/main/models/models_checklist.txt
Verwendungsprozess
- Textgesteuerte Bilderzeugung ::
- Führen Sie den folgenden Befehl aus, um die Gradio-Schnittstelle zu starten:
CUDA_VISIBLE_DEVICES=0 python app.py
- Oder führen Sie einfach den folgenden Befehl aus, um ein Bild zu erzeugen:
CUDA_VISIBLE_DEVICES=0 python inference/test_t2i.py
- Tipp: Um schöne Bilder zu produzieren, empfiehlt es sich, detaillierte Beschreibungen des Motivs, des Hintergrunds, der Farben, des Lichts und der Atmosphäre zu verwenden und hochwertige Modifikatoren wie "hochwertig", "detailreich", "8K ", "fotorealistisch", "filmische Beleuchtung", etc. Zum Beispiel:
一幅令人惊叹的日落图,背景是宁静的山脉,天空中充满了鲜艳的橙色和紫色,高质量,细节丰富,8k,照片级真实,电影级光效,完美。
- Führen Sie den folgenden Befehl aus, um die Gradio-Schnittstelle zu starten:
- Speicherverwaltung ::
- Um Speicherressourcen zu sparen, empfiehlt es sich, die Option
--stage_a_tiled
Parameter.
- Um Speicherressourcen zu sparen, empfiehlt es sich, die Option
Beispielhafte Tipps
- Erstellen Sie personalisierte Bilder von Katzen ::
Laden Sie das Personalisierungsmodell herunter und führen Sie den folgenden Befehl aus, um die Personalisierungsergebnisse zu generieren:
CUDA_VISIBLE_DEVICES=0 python inference/test_t2i.py --model_path path_to_personalized_model
Ein-Klick-Installationspaket
Die Grafikkarte darf nicht weniger als 16 GB, der Speicher nicht weniger als 40 GB groß sein.