AI个人学习
和实操指南
豆包Marscode1

ACE++:用文本指令精准对图像局部编辑的多功能开源工具

综合介绍

ACE++ 是由阿里巴巴通义实验室(Tongyi Lab)的 ali-vilab 团队开发的一个开源项目。它基于 FLUX.1-Fill-dev 模型,旨在通过简单的文字指令实现图像生成和编辑。项目将参考图像生成、局部编辑和可控生成统一在一个框架内,提供三种 LoRA 模型(肖像、物体、局部编辑)和一个更通用的 FFT 模型。用户可以免费从 GitHub 下载代码和模型,最近更新时间为 2025 年 3 月 11 日。ACE++ 适合开发者、设计师和普通用户,既支持命令行操作,也能在 ComfyUI 中使用。

ACE++ 在换脸、换装中对比专用工具没有明显短板,由于最近推出的 Gemini 2.0 Flash 十分亮眼,也是主打文本指令控制图像局部编辑,他们二者效果可以自行对比。

ACE++:用文本指令精准对图像局部编辑的多功能开源工具-1

 

功能列表

  • 指令生成图像:输入文字描述生成新图像,例如“一个穿警服的女孩”。
  • 局部图像编辑:修改图片指定区域,比如替换背景或调整服装。
  • 参考图像生成:基于一张参考图生成相似风格的新图。
  • 多模型选择:提供肖像、物体、局部编辑三种 LoRA 模型和一个 FFT 模型。
  • ComfyUI 支持:通过图形界面操作,简化工作流程。
  • 自定义训练:用户可以用自己的数据训练模型,适配特定任务。
  • 高级功能:支持超分辨率、换脸、物体替换等扩展应用。

 

使用帮助

安装流程

ACE++ 需要配置环境才能运行。以下是详细步骤:

  1. 准备环境
    • 确保电脑安装 Python 3.8 或以上版本,可用 python --version 检查。
    • 安装 Git,Windows 用户从官网下载,Mac 用户运行 brew install git
    • 推荐使用 NVIDIA GPU,至少 12GB 显存,CPU 也能运行但速度慢。
  2. 下载代码
    • 打开终端,运行:
      git clone https://github.com/ali-vilab/ACE_plus.git
      cd ACE_plus
      
    • 这会下载项目到本地。
  3. 安装依赖
    • 输入命令安装所需库:
      pip install -r repo_requirements.txt
      
    • 如遇权限问题,加 --user 参数。
  4. 下载模型
    • ACE++ 依赖 FLUX.1-Fill-dev 模型,设置环境变量:
      export FLUX_FILL_PATH="hf://black-forest-labs/FLUX.1-Fill-dev"
      
    • 下载 LoRA 模型(可选):
      export PORTRAIT_MODEL_PATH="hf://ali-vilab/ACE_Plus@portrait/comfyui_portrait_lora64.safetensors"
      export SUBJECT_MODEL_PATH="hf://ali-vilab/ACE_Plus@subject/comfyui_subject_lora16.safetensors"
      export LOCAL_MODEL_PATH="hf://ali-vilab/ACE_Plus@local_editing/comfyui_local_lora16.safetensors"
      
    • FFT 模型(可选):
      export ACE_PLUS_FFT_MODEL="ms://iic/ACE_Plus@ace_plus_fft.safetensors"
      
    • 可从 Hugging Face 或 ModelScope 手动下载,放入项目目录。
  5. 测试运行
    • 运行以下命令检查环境:
      python infer_lora.py
      
    • 若输出正常,说明安装成功。

如何使用主要功能

指令生成图像

  • 操作步骤
    1. 输入文字描述,如“一只白色的老猫头鹰”。
    2. 运行:
      python infer_lora.py --prompt "1 white old owl"
      
    3. 结果保存在 output 文件夹。
  • 提示:描述越详细,效果越好。FFT 模型适合复杂任务。

局部图像编辑

  • 操作步骤
    1. 准备图片(如 example.jpg)和掩码(如 mask.png),掩码白色区域为编辑部分。
    2. 运行:
      python infer_lora.py --image example.jpg --mask mask.png --prompt "add a red hat"
      
    3. 编辑后的图片自动保存。
  • 技巧:掩码可用画图工具制作,确保区域清晰。

参考图像生成

  • 操作步骤
    1. 准备参考图片(如 ref.jpg)。
    2. 输入描述,如“草原上的男孩,保持相同风格”。
    3. 运行:
      python infer_lora.py --ref ref.jpg --prompt "a boy on the grassland in the same style"
      
    4. 结果保留参考图风格。
  • 建议:参考图风格明显时效果最佳。

使用 ComfyUI

  • 安装 ComfyUI
    1. 下载 ComfyUI:
      git clone https://github.com/comfyanonymous/ComfyUI.git
      
    2. 将 ACE++ 模型放入 ComfyUI/models 文件夹。
    3. 启动:
      cd ComfyUI
      python main.py
      
  • 操作
    1. 打开浏览器,访问 http://localhost:8188
    2. 导入 ACE++ 工作流(位于 workflow/ComfyUI-ACE_Plus)。
    3. 上传图片或输入文字,按界面提示调整参数,点击运行。
  • 优点:图形界面适合新手,操作更直观。

自定义训练

  • 准备数据
    1. 参考 data/train.csv,准备训练数据,格式为:
      edit_image,edit_mask,ref_image,target_image,prompt,data_type
      
    2. 字段说明:编辑任务填 edit_image 和 mask,参考生成填 ref_image
  • 运行训练
    1. 配置 train_config/ace_plus_lora.yaml,调整参数。
    2. 运行:
      python run_train.py --cfg train_config/ace_plus_lora.yaml
      
    3. 训练模型保存在 examples/exp_example

特色功能操作

LoRA 模型切换

  • 方法
    1. 设置环境变量,如用肖像模型:
      export MODEL_PATH="hf://ali-vilab/ACE_Plus@portrait/comfyui_portrait_lora64.safetensors"
      
    2. 运行 infer_lora.py,效果偏向肖像优化。
  • 用途:肖像模型适合人脸,物体模型适合物品,局部编辑模型适合区域调整。

FFT 模型使用

  • 方法
    1. 设置:
      export ACE_PLUS_FFT_MODEL="ms://iic/ACE_Plus@ace_plus_fft.safetensors"
      
    2. 运行:
      python infer_fft.py
      
  • 特点:支持更多任务,但性能可能不如 LoRA 稳定,适合学术研究。

高级应用

  • 换脸
    1. 准备参考人脸和目标图片。
    2. 用 ComfyUI 工作流 ACE_Plus_FFT_workflow_referenceediting_generation.json,输入指令如“男人面向镜头”。
  • 超分辨率
    1. 用 ACE_Plus_FFT_workflow_no_preprocess.json,输入低分辨率图和描述。
    2. 输出高清图像。

 

应用场景

  1. 个性化头像设计
    用户输入描述或上传照片,生成卡通头像,如“戴眼镜的笑脸女孩”。
  2. 电商商品优化
    商家编辑商品图,比如将衣服改成蓝色,添加背景,提升购买率。
  3. 电影海报制作
    用换脸功能替换演员面孔,或调整海报元素,快速生成创意设计。

 

QA

  1. ACE++ 免费吗?
    是的,ACE++ 是开源项目,代码和模型免费提供,可从 GitHub 下载。
  2. 运行出错怎么办?
    检查 Python 版本、依赖安装和模型路径。若无法解决,在 GitHub Issues 提交问题。
  3. FFT 模型和 LoRA 模型哪个更好?
    LoRA 模型在特定任务上更稳定,FFT 模型更通用但性能可能下降,推荐根据需求选择。

未经允许不得转载:首席AI分享圈 » ACE++:用文本指令精准对图像局部编辑的多功能开源工具

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文