PiT: herramienta para unir imágenes completas a partir de partes de imágenes (no abierta)
Últimos recursos sobre IAPublicado hace 5 meses Círculo de intercambio de inteligencia artificial 1.6K 00
Introducción general
PiT (Piece it Together) es una herramienta de código abierto alojada en GitHub y desarrollada por investigadores como Elad Richardson, de la Universidad de Tel Aviv. Permite a los usuarios introducir fragmentos de una imagen, como alas, peinados u ojos, y luego utilizar técnicas de inteligencia artificial para generar una imagen completa. PiT elimina la necesidad de descripciones textuales, utilizando las partes de la imagen como entrada, y se basa en un modelo preentrenado, IP-Prior, para rellenar las piezas que faltan, y finalmente renderiza el resultado mediante SDXL. Esta herramienta es idónea para que diseñadores visuales o investigadores reconstruyan rápidamente ideas creativas. El código y la descripción más recientes de PiT a 25 de marzo de 2025 pueden consultarse en GitHub.

Lista de funciones
- rompecabezas: Entrada de partes fragmentadas de la imagen para generar una imagen completa.
- Atención al detalle: Las imágenes complementarias se mantienen constantes en todo momento, en función de las características de la pieza.
- Entrada de imagen pura: No se necesitan instrucciones de texto, sólo imágenes para funcionar.
- Múltiples resultadosSoporte para diferentes números de piezas, generando una amplia gama de imágenes posibles.
- proyecto de código abiertoEl código está disponible públicamente en GitHub y puede descargarse y modificarse libremente.
- Estilos disponibles: Admite la generación de imágenes de estilos específicos mediante el ajuste IP-LoRA.
- adaptación del dominio: Se pueden utilizar distintos modelos de IP-Prior para generar imágenes adecuadas a temas específicos.
Utilizar la ayuda
PiT es un proyecto de código abierto en GitHub para usuarios con conocimientos básicos de programación. Aquí tienes una guía detallada de instalación y uso que te ayudará a empezar rápidamente.
Proceso de instalación
- Preparar el entorno
- Asegúrate de que tu ordenador tiene Python 3.8 o superior.
- Instalación de Git (Windows desde
git-scm.com
Descargar, Entrada Mac/Linuxgit --version
(Jaque). - Se recomienda utilizar un dispositivo con GPU (por ejemplo, tarjeta gráfica NVIDIA con CUDA) para acelerar la generación. Se puede utilizar sin GPU, pero es más lento.
- Descargar código
- Abra un terminal o una línea de comandos.
- Introduzca el comando para descargar PiT:
git clone https://github.com/eladrich/PiT.git
- Vaya a la carpeta del proyecto:
cd PiT
- Instalación de dependencias
- El proyecto requiere bibliotecas Python como
torch
ynumpy
La lista está enrequirements.txt
Medio. - Ejecute el comando para instalar:
pip install -r requirements.txt
- Si no dispone de este archivo, consulte el LÉAME para instalarlo.
diffusers
ytransformers
etc.
- El proyecto requiere bibliotecas Python como
- Obtener el modelo
- PiT se basa en los modelos IP-Prior e IP-Adapter+, los enlaces de descarga están en GitHub o en el documento (https://arxiv.org/abs/2503.10365).
- Coloca el modelo en el directorio especificado (por ejemplo
models/
), consulte README para conocer la ruta.
- Instalación de SDXL
- PiT renderiza imágenes con SDXL. Instalación
diffusers
::pip install diffusers
- Descarga el modelo SDXL de Hugging Face y guárdalo localmente.
- PiT renderiza imágenes con SDXL. Instalación
Utilización
- Preparar las piezas
- Se recomienda recopilar partes de imágenes (por ejemplo, orejas, logotipos) en formato PNG con un fondo limpio.
- En la carpeta de entrada del proyecto (por ejemplo
input/
).
- programa de carrera
- Introduzca el directorio PiT en el terminal.
- Ejecute el script (suponiendo que
generate.py
(consulte el archivo README para obtener más información):python generate.py --input_dir input/ --output_dir output/
- Descripción de los parámetros:
--input_dir
Carpeta de piezas.--output_dir
: Los resultados se guardan en la carpeta.
- El programa genera la imagen completa con la pieza.
- Ver la imagen
- Después de generar, abra el
output/
Vista de carpetas. - Si no está satisfecho, añada más piezas o cambie la imagen clara.
- Después de generar, abra el
Función destacada Operación
- Número de piezas
Puede introducir 1 o más partes. Por ejemplo, introduzca "pata" y "cola" para generar un animal completo. Es mejor tener el mismo estilo de partes. - estilismo
Las señales de estilo pueden añadirse con IP-LoRA. Ejemplo:python generate.py --input_dir input/ --output_dir output/ --prompt "卡通风格"
Así es posible generar imágenes caricaturescas.
- (matem.) modelo de dominio conmutativo
PiT admite diferentes modelos de IP-Prior (por ejemplo, juguetes, criaturas). El archivo de modelo correspondiente se carga al cambiar, ver README para el funcionamiento. - Resultados de la optimización
Si la imagen es borrosa, compruebe si la parte es clara o añada parámetros:python generate.py --input_dir input/ --steps 50
advertencia
- Las piezas deben ser claras y evitar ser demasiado pequeñas o recargadas.
- La primera carrera es lenta, las siguientes serán rápidas.
- En caso de error, instale las bibliotecas que faltan.
Estos pasos le ayudarán a montar una imagen completa con PiT. La operación requiere programación, pero el proceso es sencillo.
escenario de aplicación
- Inspiración en el diseño
Los diseñadores introducen piezas (por ejemplo, alas, sombreros) para componer personajes completos y probar ideas rápidamente. - Concepto de producto
Los desarrolladores utilizan piezas (por ejemplo, botones, formas) para generar nuevas imágenes de productos y explorar direcciones de diseño. - Aprendizaje técnico
Los investigadores utilizaron PiT para probar cómo la IA puede desconcertar a partir de piezas para comprender los principios de la generación de imágenes.
CONTROL DE CALIDAD
- ¿Cuál es la diferencia entre PiT y otras herramientas?
PiT es un puzzle directo con piezas de imagen, sin texto, adecuado para la creación visual. - ¿Hay que entrenar el modelo?
No es necesario, hay modelos oficiales preentrenados, pero puedes entrenarlos y ajustarlos tú mismo. - ¿Es rápido de generar?
No es rápido, tarda de unos segundos a unos minutos dependiendo del dispositivo.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...