TryOffAnyone: herramienta de IA para extraer prendas de vestir de una persona como imagen de visualización de prendas en mosaico.

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

52.4K 00

Introducción general

TryOffAnyone es una innovadora herramienta de procesamiento de imágenes de inteligencia artificial diseñada para resolver los problemas de la exposición de ropa en el comercio electrónico. Es capaz de convertir de forma inteligente fotos de ropa de personas reales en estado de uso en imágenes con efecto de pantalla plana, una tecnología basada en los últimos modelos de difusión latente (LDM). La principal innovación del proyecto, desarrollado y de código abierto por investigadores, reside en su capacidad para identificar y extraer con precisión zonas de ropa en la foto de una persona y convertirlas en un efecto de pantalla plana profesional mediante un complejo algoritmo de inteligencia artificial. Este avance tecnológico no solo reduce significativamente el coste de producción de imágenes de productos para plataformas de comercio electrónico, sino que también proporciona una solución más cómoda y estandarizada para la exposición de productos de ropa. El proyecto es de código abierto en GitHub, admite una rápida implantación y uso en entorno Python, y proporciona documentación detallada de uso y código de ejemplo.

Experiencia: https://huggingface.co/spaces/1aurent/TryOffAnyone

Lista de funciones

Admite la función de procesamiento directo de URL de imágenes en línea
Reconocimiento y extracción inteligentes de zonas de prendas de vestir en imágenes
Convierte automáticamente las prendas desgastadas en prendas planas.
Procesamiento profesional integrado de eliminación de fondo y optimización de imágenes
Admite la función de prueba por lotes para el conjunto de datos VITON-HD
Proporcionar cálculos detallados de las métricas de evaluación del modelo
Integración de múltiples métodos de evaluación de la calidad de la imagen (SSIM, LPIPS, FID, KID)
Admite tamaños de imagen y parámetros de procesamiento personalizados
Capacidad de despliegue rápido de modelos preentrenados
Admite procesamiento acelerado por GPU

Utilizar la ayuda

1. Configuración e instalación del entorno

Lo primero que tienes que hacer es asegurarte de que tu sistema cumple los siguientes requisitos:

Entorno Python 3.x
GPU compatibles con CUDA (recomendadas para el procesamiento acelerado)
Herramientas de control de versiones Git

Pasos de la instalación:

# 1. 克隆项目代码
git clone https://github.com/ixarchakos/try-off-anyone.git
cd try-off-anyone
# 2. 安装依赖包
python3 -m pip install -r requirements.txt
# 3. 下载预训练模型
# 访问 https://huggingface.co/ixarchakos/tryOffAnyone
# 将下载的模型文件放置在 "try-off-anyone/ckpt/" 目录下

2. Uso básico

2.1 Tratamiento de una sola imagen en línea

python3 main.py --inference --url="您的图片URL地址"

Las imágenes procesadas se guardarán en el directorio "try-off-anyone/data/".

2.2 Descripción de la configuración de parámetros

--seed: configuración de la semilla aleatoria (por defecto: 36)
--steps: número de pasos de procesamiento (por defecto: 50)
--scale: escala (por defecto: 2,5)
--width: ancho de la imagen de salida (por defecto: 384)
--height: altura de la imagen de salida (por defecto: 512)
--gpu_id: especifica el ID del dispositivo GPU (por defecto: 0)

3. Utilización de funciones avanzadas

3.1 Tratamiento por lotes de los conjuntos de datos VITON-HD

Descargar el conjunto de datos en bruto de VITON-HD
Descargue el archivo de máscara de imagen de la prenda:
- Visite: https://huggingface.co/ixarchakos/tryOffAnyone/blob/main/masks.zip
- Extráigalo al directorio "try-off-anyone/data/zalando-hd-resized/test/".

Realizar el tratamiento por lotes:

python3 main.py --test

3.2 Evaluación de la calidad

El sistema calcula automáticamente los siguientes indicadores:

SSIM (similitud estructural)
LPIPS (similitud percibida)
FID (Distancia de inicio de Fréchet)
KID (distancia de inicio del núcleo)

4. Notas y recomendaciones

Para las imágenes de entrada se recomienda utilizar fotos claras de la ropa de frente
La versión actual admite principalmente el tratamiento por carga superior
Se recomienda utilizar la GPU para el procesamiento a fin de obtener un mejor rendimiento.
Control del uso de recursos del sistema al procesar grandes cantidades de imágenes
Actualice periódicamente los modelos y paquetes de dependencias para obtener mejores resultados.

5. Resolución de problemas comunes

Si encuentras errores relacionados con CUDA, compruébalo:
- ¿Está instalado correctamente el controlador de la GPU?
- ¿Coincide la versión CUDA con la versión PyTorch?
Problemas de calidad en el tratamiento de imágenes:
- Ajuste el parámetro --steps para añadir pasos de procesamiento
- Ajusta el parámetro -escala según convenga para mejorar el efecto
Problema de memoria insuficiente:
- Reducir el tamaño de los lotes
- Reducir el tamaño de la imagen de entrada