综合介绍
InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生成新图像,同时保留人物身份特征。项目通过 InfuseNet 技术提升身份相似度,结合多阶段训练优化图像质量和文字对齐。InfiniteYou 于 2025 年 3 月发布代码、模型和在线演示,受到技术社区关注。它支持多种插件,操作简单,适合开发者、研究者和普通用户。
功能列表
- 身份保留重塑:上传照片和文字描述,生成新图像并保持人物面部特征。
- 高质量图像生成:输出清晰图像,减少模糊、手部畸形等问题。
- 文字对齐优化:生成结果与描述内容高度一致,避免偏差。
- 模型选择:提供
aes_stage2
(美观优先)和sim_stage1
(身份优先)两种模式。 - 插件扩展:支持 ControlNet、LoRA、IP-Adapter 等,增加生成灵活性。
使用帮助
安装流程
InfiniteYou 需要本地安装才能使用。以下是详细步骤:
- 环境准备
- 确保系统安装 Python 3.8 或更高版本。
- 安装 Git,用于下载代码。
- 推荐使用 NVIDIA GPU 和 CUDA,提升生成速度。
- 克隆代码
在终端输入:
git clone https://github.com/bytedance/InfiniteYou.git
进入目录:
cd InfiniteYou
- 安装依赖
执行以下命令安装所需库:
pip install -r requirements.txt
若使用 GPU,需安装对应 PyTorch 版本,例如:
pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
- 下载模型
访问 https://huggingface.co/ByteDance/InfiniteYou,下载infu_flux_v1.0
文件夹中的aes_stage2
或sim_stage1
模型,放入项目目录对应位置。 - 运行演示
安装 Gradio:
pip install gradio
启动本地界面:
python app.py
浏览器会打开 http://127.0.0.1:7860
,即可使用。
主要功能操作
身份保留照片重塑
- 上传照片
在 Gradio 界面点击“上传身份图像”,选择一张清晰的人脸照片。 - 输入描述
在“提示文字”框输入具体描述,例如“一个穿红裙的女子在森林中”。 - 设置参数
- 模型选择:
aes_stage2
注重美观,sim_stage1
强调身份相似度。 - 参数调整:默认
infusenet_conditioning_scale
为1.0
,infusenet_guidance_start
为0.0
。若身份不够相似,可尝试将后者调至0.1
。 - 种子值(Seed):保持默认或手动设置。
- 生成图像
点击“生成”,等待约 120 秒,结果会显示在界面上。
快速脚本推理
在终端运行:
python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results
生成结果保存在 results
文件夹。
在线演示
访问 https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX,无需安装即可试用。
插件使用
- ControlNet:上传姿势参考图,控制生成结果的动作。
- LoRA:支持 Realism 和 Anti-blur 插件,路径需手动指定,例如
<path_to_lora>
。 - IP-Adapter:添加风格参考图,实现个性化风格化。
操作示例
想生成“穿西装的男子在会议室”的图像:
- 上传男子照片。
- 输入描述:“A man in a suit in a meeting room”。
- 选择
aes_stage2
,点击“生成”。 - 检查结果,若需调整性别,添加“a man”等词。
注意事项
- 照片需正面清晰,避免遮挡。
- 描述具体,避免模糊词如“漂亮”。
- 生成时间因硬件不同而异,GPU 可缩短至 30-60 秒。
应用场景
- 社交媒体内容
用户上传自拍,输入“穿运动服在健身房”,生成健身主题照片用于分享。 - 艺术创作
艺术家上传肖像,描述“穿中世纪服装的骑士”,生成概念设计图。 - 研究测试
研究者使用 InfiniteYou 对比身份保留效果,验证生成模型性能。
QA
- 免费吗?
是的。代码和模型开源,学术研究免费使用。 - 生成时间多长?
平均 120 秒,使用 GPU 可更快。 - 支持多人照片吗?
当前优化为单人,多人支持需进一步开发。