综合介绍
UltraPixel 是一项先进的超高分辨率图像生成技术,旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发,并在 NeurIPS 2024 上展示。UltraPixel 支持从 1K 到 6K 的任意分辨率图像生成,效果媲美 MidJourney 和 DALL·E 3,显著提升了图像生成的质量和细节。
- 高分辨率图像生成 :支持从 1K 到 6K 的任意分辨率图像生成。
- 多种模型支持 :提供多种预训练模型,用户可根据需求选择合适的模型。
- 文本引导图像生成 :通过详细的文本描述生成高质量图像。
- Gradio 界面 :提供 Gradio 界面,方便用户进行图像生成操作。
- 高效内存管理 :支持 tiled 解码,节省内存资源。
使用帮助
安装流程
- 安装依赖 :运行以下命令安装所需依赖:
pip install -r requirements.txt
- 下载预训练模型 :根据 README 文件中的链接下载预训练模型,并将其放置在
models
目录下。 - 下载 UltraPixel 参数 :从提供的链接下载 UltraPixel 的新增参数,并放置在
models
目录下。 - 从此处下载 UltraPixel 新增参数。
- 模型列表:https://github.com/catcathh/UltraPixel/blob/main/models/models_checklist.txt
使用流程
- 文本引导图像生成 :
- 运行以下命令启动 Gradio 界面:
CUDA_VISIBLE_DEVICES=0 python app.py
- 或者直接运行以下命令生成图像:
CUDA_VISIBLE_DEVICES=0 python inference/test_t2i.py
- 提示:为了生成美观的图像,建议使用详细的描述,包括主体、背景、颜色、光线和氛围等,并使用高质量修饰词如“高质量”、“细节丰富”、“8k”、“照片级真实”、“电影级光效”等。例如:
一幅令人惊叹的日落图,背景是宁静的山脉,天空中充满了鲜艳的橙色和紫色,高质量,细节丰富,8k,照片级真实,电影级光效,完美。
- 运行以下命令启动 Gradio 界面:
- 内存管理 :
- 为了节省内存资源,建议在 stage a 解码时添加
--stage_a_tiled
参数。
- 为了节省内存资源,建议在 stage a 解码时添加
示例提示
- 生成猫的个性化图像 :
下载个性化模型并运行以下命令生成个性化结果:
CUDA_VISIBLE_DEVICES=0 python inference/test_t2i.py --model_path path_to_personalized_model
一键安装包
显卡不能少于16G,内存不能低于40G