AI个人学习
和实操指南
豆包Marscode1

InfiniteYou:保留人脸特征的照片生成与编辑工具

综合介绍

InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生成新图像,同时保留人物身份特征。项目通过 InfuseNet 技术提升身份相似度,结合多阶段训练优化图像质量和文字对齐。InfiniteYou 于 2025 年 3 月发布代码、模型和在线演示,受到技术社区关注。它支持多种插件,操作简单,适合开发者、研究者和普通用户。

InfiniteYou:保留人脸特征的照片生成与编辑工具-1


 

功能列表

  • 身份保留重塑:上传照片和文字描述,生成新图像并保持人物面部特征。
  • 高质量图像生成:输出清晰图像,减少模糊、手部畸形等问题。
  • 文字对齐优化:生成结果与描述内容高度一致,避免偏差。
  • 模型选择:提供 aes_stage2(美观优先)和 sim_stage1(身份优先)两种模式。
  • 插件扩展:支持 ControlNet、LoRA、IP-Adapter 等,增加生成灵活性。

 

使用帮助

安装流程

InfiniteYou 需要本地安装才能使用。以下是详细步骤:

  1. 环境准备
    • 确保系统安装 Python 3.8 或更高版本。
    • 安装 Git,用于下载代码。
    • 推荐使用 NVIDIA GPU 和 CUDA,提升生成速度。
  2. 克隆代码
    在终端输入:
git clone https://github.com/bytedance/InfiniteYou.git

进入目录:

cd InfiniteYou
  1. 安装依赖
    执行以下命令安装所需库:
pip install -r requirements.txt

若使用 GPU,需安装对应 PyTorch 版本,例如:

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124
  1. 下载模型
    访问 https://huggingface.co/ByteDance/InfiniteYou,下载 infu_flux_v1.0 文件夹中的 aes_stage2 或 sim_stage1 模型,放入项目目录对应位置。
  2. 运行演示
    安装 Gradio:
pip install gradio

启动本地界面:

python app.py

浏览器会打开 http://127.0.0.1:7860,即可使用。

主要功能操作

身份保留照片重塑

  1. 上传照片
    在 Gradio 界面点击“上传身份图像”,选择一张清晰的人脸照片。
  2. 输入描述
    在“提示文字”框输入具体描述,例如“一个穿红裙的女子在森林中”。
  3. 设置参数
  • 模型选择:aes_stage2 注重美观,sim_stage1 强调身份相似度。
  • 参数调整:默认 infusenet_conditioning_scale 为 1.0infusenet_guidance_start 为 0.0。若身份不够相似,可尝试将后者调至 0.1
  • 种子值(Seed):保持默认或手动设置。
  1. 生成图像
    点击“生成”,等待约 120 秒,结果会显示在界面上。

快速脚本推理

在终端运行:

python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人,肖像,电影风格" --out_results_dir ./results

生成结果保存在 results 文件夹。

在线演示

访问 https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX,无需安装即可试用。

插件使用

  • ControlNet:上传姿势参考图,控制生成结果的动作。
  • LoRA:支持 Realism 和 Anti-blur 插件,路径需手动指定,例如 <path_to_lora>
  • IP-Adapter:添加风格参考图,实现个性化风格化。

操作示例

想生成“穿西装的男子在会议室”的图像:

  1. 上传男子照片。
  2. 输入描述:“A man in a suit in a meeting room”。
  3. 选择 aes_stage2,点击“生成”。
  4. 检查结果,若需调整性别,添加“a man”等词。

注意事项

  • 照片需正面清晰,避免遮挡。
  • 描述具体,避免模糊词如“漂亮”。
  • 生成时间因硬件不同而异,GPU 可缩短至 30-60 秒。

 

应用场景

  1. 社交媒体内容
    用户上传自拍,输入“穿运动服在健身房”,生成健身主题照片用于分享。
  2. 艺术创作
    艺术家上传肖像,描述“穿中世纪服装的骑士”,生成概念设计图。
  3. 研究测试
    研究者使用 InfiniteYou 对比身份保留效果,验证生成模型性能。

 

QA

  1. 免费吗?
    是的。代码和模型开源,学术研究免费使用。
  2. 生成时间多长?
    平均 120 秒,使用 GPU 可更快。
  3. 支持多人照片吗?
    当前优化为单人,多人支持需进一步开发。
未经允许不得转载:首席AI分享圈 » InfiniteYou:保留人脸特征的照片生成与编辑工具
zh_CN简体中文