ACE++: una versátil herramienta de código abierto para la edición local precisa de imágenes con comandos de texto
Últimos recursos sobre IAPublicado hace 6 meses Círculo de intercambio de inteligencia artificial 12.3K 00
Introducción general
ACE++ es un proyecto de código abierto desarrollado por el equipo ali-vilab de Alibaba Tongyi Lab. Se basa en FLUX.1-Modelo fill-dev diseñado para permitir la generación y edición de imágenes mediante sencillos comandos textuales. El proyecto unifica la generación de imágenes de referencia, la edición local y la generación controlada en un único marco, proporcionando tres modelos LoRA (retrato, objeto, edición local) y un modelo FFT más general. El código y los modelos pueden descargarse gratuitamente de GitHub y se actualizaron por última vez el 11 de marzo de 2025. ACE++ es adecuado para desarrolladores, diseñadores y usuarios en general, y admite tanto operaciones de línea de comandos como la posibilidad de crear imágenes en la interfaz de usuario. ComfyUI Utilizado en.
ACE++ no tiene deficiencias significativas en el cambio de caras y el aderezo en comparación con las herramientas dedicadas, gracias al recientemente lanzado Gemini 2.0 Flash Muy brillante, también el comando de texto principal de control de imagen de edición local, los dos efectos se pueden comparar por sí mismos.

Lista de funciones
- Comando para generar una imagen: Introduzca una descripción de texto para generar una nueva imagen, por ejemplo, "Una chica con uniforme de policía".
- Edición local de imágenes: Modifica áreas específicas de una imagen, como sustituir el fondo o ajustar la ropa.
- Generación de imágenes de referencia: Genera un nuevo dibujo de estilo similar a partir de un dibujo de referencia.
- Selección multimodelo: Se dispone de tres modelos LoRA para retratos, objetos, edición local y un modelo FFT.
- Soporte ComfyUI: Flujo de trabajo simplificado gracias al funcionamiento de la interfaz gráfica.
- Formación a medidaLos usuarios pueden entrenar modelos con sus propios datos, adaptados a tareas específicas.
- Funciones avanzadas: Se admiten aplicaciones ampliadas como la superresolución, el intercambio de caras, la sustitución de objetos, etc.
Utilizar la ayuda
Proceso de instalación
ACE++ requiere un entorno configurado para ejecutarse. A continuación se detallan los pasos a seguir:
- Preparar el entorno
- Asegúrese de que Python 3.8 o posterior está instalado en su ordenador, y que puede utilizar el comando
python --version
Compruébalo. - Para instalar Git, descárgalo del sitio web para usuarios de Windows y ejecútalo para usuarios de Mac.
brew install git
. - Se recomiendan GPUs NVIDIA con al menos 12GB de RAM, las CPUs pueden funcionar pero son lentas.
- Asegúrese de que Python 3.8 o posterior está instalado en su ordenador, y que puede utilizar el comando
- Descargar código
- Abre un terminal y ejecútalo:
git clone https://github.com/ali-vilab/ACE_plus.git cd ACE_plus
- Esto descargará el proyecto localmente.
- Abre un terminal y ejecútalo:
- Instalación de dependencias
- Introduzca el comando para instalar las bibliotecas necesarias:
pip install -r repo_requirements.txt
- Si tiene problemas con los permisos, añada
--user
Parámetros.
- Introduzca el comando para instalar las bibliotecas necesarias:
- Descargar modelos
- ACE++ se basa en el modelo FLUX.1-Fill-dev para establecer variables de entorno:
export FLUX_FILL_PATH="hf://black-forest-labs/FLUX.1-Fill-dev"
- Descarga el modelo LoRA (opcional):
export PORTRAIT_MODEL_PATH="hf://ali-vilab/ACE_Plus@portrait/comfyui_portrait_lora64.safetensors" export SUBJECT_MODEL_PATH="hf://ali-vilab/ACE_Plus@subject/comfyui_subject_lora16.safetensors" export LOCAL_MODEL_PATH="hf://ali-vilab/ACE_Plus@local_editing/comfyui_local_lora16.safetensors"
- Modelo FFT (opcional):
export ACE_PLUS_FFT_MODEL="ms://iic/ACE_Plus@ace_plus_fft.safetensors"
- Puede descargarse manualmente de Hugging Face o ModelScope y colocarse en el directorio del proyecto.
- ACE++ se basa en el modelo FLUX.1-Fill-dev para establecer variables de entorno:
- prueba de funcionamiento
- Ejecute el siguiente comando para comprobar el entorno:
python infer_lora.py
- Si la salida es normal, la instalación se ha realizado correctamente.
- Ejecute el siguiente comando para comprobar el entorno:
Cómo utilizar las principales funciones
Comando para generar una imagen
- procedimiento::
- Introduzca una descripción de texto como "un viejo búho blanco".
- Corriendo:
python infer_lora.py --prompt "1 white old owl"
- Los resultados se guardan en el archivo
output
Carpeta.
- llamar la atención sobre algoCuanto más detallada sea la descripción, mejores serán los resultados. el modelo FFT es adecuado para tareas complejas.
Edición local de imágenes
- procedimiento::
- Preparar imágenes (por ejemplo
example.jpg
) y la máscara (por ejemplomask.png
), enmascarando el área blanca para la sección de edición. - Corriendo:
python infer_lora.py --image example.jpg --mask mask.png --prompt "add a red hat"
- La imagen editada se guarda automáticamente.
- Preparar imágenes (por ejemplo
- finura: La máscara puede crearse con la herramienta de dibujo para asegurarse de que el área está despejada.
Generación de imágenes de referencia
- procedimiento::
- Preparar imágenes de referencia (por ejemplo
ref.jpg
). - Introduzca una descripción como "Prairie Boy, mantener el mismo estilo".
- Corriendo:
python infer_lora.py --ref ref.jpg --prompt "a boy on the grassland in the same style"
- Los resultados conservan el estilo de las figuras de referencia.
- Preparar imágenes de referencia (por ejemplo
- sugerencia: Los gráficos de referencia funcionan mejor cuando el estilo es obvio.
Usando ComfyUI
- Instalar ComfyUI::
- Descargar ComfyUI:
git clone https://github.com/comfyanonymous/ComfyUI.git
- Coloque el modelo ACE++ en el
ComfyUI/models
Carpeta. - Lanzamiento:
cd ComfyUI python main.py
- Descargar ComfyUI:
- plataforma::
- Abra su navegador y visite
http://localhost:8188
. - Importe el flujo de trabajo ACE++ (ubicado en la carpeta
workflow/ComfyUI-ACE_Plus
). - Sube una imagen o introduce un texto, ajusta los parámetros según las indicaciones de la interfaz y haz clic en Ejecutar.
- Abra su navegador y visite
- vantageLa interfaz gráfica es adecuada para principiantes y su manejo es más intuitivo.
Formación a medida
- Preparar los datos::
- consulta
data/train.csv
prepara los datos de entrenamiento en el formatoedit_image,edit_mask,ref_image,target_image,prompt,data_type
- Descripción del campo: Editorial Task Fill
edit_image
responder cantandomask
Generación de referencia Rellenoref_image
.
- consulta
- entrenamiento de running::
- configure
train_config/ace_plus_lora.yaml
Ajuste los parámetros. - Corriendo:
python run_train.py --cfg train_config/ace_plus_lora.yaml
- El modelo de entrenamiento se guarda en el archivo
examples/exp_example
.
- configure
Función destacada Operación
Cambio de modelo LoRA
- metodologías::
- Configuración de variables de entorno, por ejemplo, con modelos de retrato:
export MODEL_PATH="hf://ali-vilab/ACE_Plus@portrait/comfyui_portrait_lora64.safetensors"
- estar en movimiento
infer_lora.py
El efecto se inclina hacia la optimización del retrato.
- Configuración de variables de entorno, por ejemplo, con modelos de retrato:
- utiliceLos modelos de retrato son buenos para las caras, los modelos de objeto son buenos para los objetos y los modelos de edición local son buenos para los ajustes regionales.
Uso del modelo FFT
- metodologías::
- Entorno:
export ACE_PLUS_FFT_MODEL="ms://iic/ACE_Plus@ace_plus_fft.safetensors"
- Corriendo:
python infer_fft.py
- Entorno:
- especificidadesAdmite más tareas, pero el rendimiento puede no ser tan estable como LoRA, adecuado para la investigación académica.
Aplicaciones avanzadas
- trasplante de cara::
- Preparar las imágenes de referencia de la cara y del objetivo.
- Usando ComfyUI flujo de trabajo
ACE_Plus_FFT_workflow_referenceediting_generation.json
Comandos de entrada como "hombre frente a cámara".
- superresolución::
- gasto o desembolso
ACE_Plus_FFT_workflow_no_preprocess.json
Introduzca un diagrama de baja resolución y una descripción. - Emite imágenes de alta definición.
- gasto o desembolso
escenario de aplicación
- Diseño personalizado de avatares
Los usuarios introducen una descripción o suben una foto para generar un avatar de dibujos animados, como "Chica sonriente con gafas". - Optimización de productos de comercio electrónico
Los comerciantes editan las imágenes de los productos, por ejemplo cambiando la ropa a azul y añadiendo fondos para aumentar los índices de compra. - Producción de carteles cinematográficos
Sustituya las caras de los actores con la función Face Swap o ajuste los elementos del cartel para generar rápidamente diseños creativos.
CONTROL DE CALIDAD
- ¿Es gratuito ACE++?
Sí, ACE++ es un proyecto de código abierto con código y modelos disponibles gratuitamente para su descarga desde GitHub. - ¿Qué ocurre si aparece un error de ejecución?
Comprueba la versión de Python, la instalación de dependencias y la ruta del modelo. Si no puedes solucionarlo, envía la incidencia a GitHub Issues. - ¿Qué es mejor, el modelo FFT o el modelo LoRA?
El modelo LoRA es más estable en tareas específicas, el modelo FFT es más general pero el rendimiento puede degradarse, se recomienda elegir en función de los requisitos.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...