InfiniteYou：保留人脸特征的照片生成与编辑工具

58.3K 00

综合介绍

InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器（DiTs）技术，使用 FLUX.1-dev 模型，核心功能是让用户上传照片并输入文字描述，生成新图像，同时保留人物身份特征。项目通过 InfuseNet 技术提升身份相似度，结合多阶段训练优化图像质量和文字对齐。InfiniteYou 于 2025 年 3 月发布代码、模型和在线演示，受到技术社区关注。它支持多种插件，操作简单，适合开发者、研究者和普通用户。

功能列表

身份保留重塑：上传照片和文字描述，生成新图像并保持人物面部特征。
高质量图像生成：输出清晰图像，减少模糊、手部畸形等问题。
文字对齐优化：生成结果与描述内容高度一致，避免偏差。
模型选择：提供 aes_stage2（美观优先）和 sim_stage1（身份优先）两种模式。
插件扩展：支持 ControlNet、LoRA、IP-Adapter 等，增加生成灵活性。

使用帮助

安装流程

InfiniteYou 需要本地安装才能使用。以下是详细步骤：

环境准备
- 确保系统安装 Python 3.8 或更高版本。
- 安装 Git，用于下载代码。
- 推荐使用 NVIDIA GPU 和 CUDA，提升生成速度。
克隆代码
在终端输入：

git clone https://github.com/bytedance/InfiniteYou.git

进入目录：

cd InfiniteYou

安装依赖
执行以下命令安装所需库：

pip install -r requirements.txt

若使用 GPU，需安装对应 PyTorch 版本，例如：

pip install torch torchvision --extra-index-url https://download.pytorch.org/whl/cu124

下载模型
访问 https://huggingface.co/ByteDance/InfiniteYou，下载 infu_flux_v1.0 文件夹中的 aes_stage2 或 sim_stage1 模型，放入项目目录对应位置。
运行演示
安装 Gradio：

pip install gradio

启动本地界面：

python app.py

浏览器会打开 http://127.0.0.1:7860，即可使用。

主要功能操作

身份保留照片重塑

上传照片
在 Gradio 界面点击“上传身份图像”，选择一张清晰的人脸照片。
输入描述
在“提示文字”框输入具体描述，例如“一个穿红裙的女子在森林中”。
设置参数

模型选择：aes_stage2 注重美观，sim_stage1 强调身份相似度。
参数调整：默认 infusenet_conditioning_scale 为 1.0，infusenet_guidance_start 为 0.0。若身份不够相似，可尝试将后者调至 0.1。
种子值（Seed）：保持默认或手动设置。

生成图像
点击“生成”，等待约 120 秒，结果会显示在界面上。

快速脚本推理

在终端运行：

python test.py --id_image ./assets/examples/yann-lecun_resize.jpg --prompt "一个男人，肖像，电影风格" --out_results_dir ./results

生成结果保存在 results 文件夹。

在线演示

访问 https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX，无需安装即可试用。

插件使用

ControlNet：上传姿势参考图，控制生成结果的动作。
LoRA：支持 Realism 和 Anti-blur 插件，路径需手动指定，例如 <path_to_lora>。
IP-Adapter：添加风格参考图，实现个性化风格化。

操作示例

想生成“穿西装的男子在会议室”的图像：

上传男子照片。
输入描述：“A man in a suit in a meeting room”。
选择 aes_stage2，点击“生成”。
检查结果，若需调整性别，添加“a man”等词。

注意事项

照片需正面清晰，避免遮挡。
描述具体，避免模糊词如“漂亮”。
生成时间因硬件不同而异，GPU 可缩短至 30-60 秒。

应用场景

社交媒体内容
用户上传自拍，输入“穿运动服在健身房”，生成健身主题照片用于分享。
艺术创作
艺术家上传肖像，描述“穿中世纪服装的骑士”，生成概念设计图。
研究测试
研究者使用 InfiniteYou 对比身份保留效果，验证生成模型性能。

QA

免费吗？
是的。代码和模型开源，学术研究免费使用。
生成时间多长？
平均 120 秒，使用 GPU 可更快。
支持多人照片吗？
当前优化为单人，多人支持需进一步开发。

最新AI资源 # AI图像风格控制 # AI开源项目

文章版权归 AI分享圈所有，未经允许请勿转载。

Perplexity AI：知名AI知识搜索引擎

最新AI资源 # AI搜索工具

2年前

060K

ReSearch：强化搜索推理能力的 Qwen2.5-7B 模型（实验）

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

050.7K

Trae：字节跳动推出的免费AI编程工具

最新AI资源 # AI IDE # AI编程

10个月前

0158.4K

OmniVinci - NVIDIA开源的全模态大语言模型

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

InfiniteYou：保留人脸特征的照片生成与编辑工具

综合介绍

功能列表

使用帮助

安装流程

主要功能操作

身份保留照片重塑

快速脚本推理

在线演示

插件使用

操作示例

注意事项

应用场景

QA

Strella：用AI进行专业访谈和深度洞察的工具

PDF Craft：PDF扫描文件转Markdown的开源工具

相关文章

Perplexity AI：知名AI知识搜索引擎

ReSearch：强化搜索推理能力的 Qwen2.5-7B 模型（实验）

Trae：字节跳动推出的免费AI编程工具

OmniVinci - NVIDIA开源的全模态大语言模型

暂无评论

最新收录

最新文章

InfiniteYou：保留人脸特征的照片生成与编辑工具

综合介绍

功能列表

使用帮助

安装流程

主要功能操作

身份保留照片重塑

快速脚本推理

在线演示

插件使用

操作示例

注意事项

应用场景

QA

Strella：用AI进行专业访谈和深度洞察的工具

PDF Craft：PDF扫描文件转Markdown的开源工具

相关文章

Perplexity AI：知名AI知识搜索引擎

ReSearch：强化搜索推理能力的 Qwen2.5-7B 模型（实验）

Trae：字节跳动推出的免费AI编程工具

OmniVinci - NVIDIA开源的全模态大语言模型

暂无评论

AI工具精选

最新收录

最新文章