PiT: herramienta para unir imágenes completas a partir de partes de imágenes (no abierta)

Últimos recursos sobre IAPublicado hace 12 meses Círculo de intercambio de inteligencia artificial

49.7K 00

Introducción general

PiT (Piece it Together) es una herramienta de código abierto alojada en GitHub y desarrollada por investigadores como Elad Richardson, de la Universidad de Tel Aviv. Permite a los usuarios introducir fragmentos de una imagen, como alas, peinados u ojos, y luego utilizar técnicas de inteligencia artificial para generar una imagen completa. PiT elimina la necesidad de descripciones textuales, utilizando las partes de la imagen como entrada, y se basa en un modelo preentrenado, IP-Prior, para rellenar las piezas que faltan, y finalmente renderiza el resultado mediante SDXL. Esta herramienta es idónea para que diseñadores visuales o investigadores reconstruyan rápidamente ideas creativas. El código y la descripción más recientes de PiT a 25 de marzo de 2025 pueden consultarse en GitHub.

Lista de funciones

rompecabezas: Entrada de partes fragmentadas de la imagen para generar una imagen completa.
Atención al detalle: Las imágenes complementarias se mantienen constantes en todo momento, en función de las características de la pieza.
Entrada de imagen pura: No se necesitan instrucciones de texto, sólo imágenes para funcionar.
Múltiples resultadosSoporte para diferentes números de piezas, generando una amplia gama de imágenes posibles.
proyecto de código abiertoEl código está disponible públicamente en GitHub y puede descargarse y modificarse libremente.
Estilos disponibles: Admite la generación de imágenes de estilos específicos mediante el ajuste IP-LoRA.
adaptación del dominio: Se pueden utilizar distintos modelos de IP-Prior para generar imágenes adecuadas a temas específicos.

Utilizar la ayuda

PiT es un proyecto de código abierto en GitHub para usuarios con conocimientos básicos de programación. Aquí tienes una guía detallada de instalación y uso que te ayudará a empezar rápidamente.

Proceso de instalación

Preparar el entorno
- Asegúrate de que tu ordenador tiene Python 3.8 o superior.
- Instalación de Git (Windows desde git-scm.com Descargar, Entrada Mac/Linux git --version (Jaque).
- Se recomienda utilizar un dispositivo con GPU (por ejemplo, tarjeta gráfica NVIDIA con CUDA) para acelerar la generación. Se puede utilizar sin GPU, pero es más lento.
Descargar código
- Abra un terminal o una línea de comandos.
- Introduzca el comando para descargar PiT:
```
git clone https://github.com/eladrich/PiT.git
```
- Vaya a la carpeta del proyecto:
```
cd PiT
```
Instalación de dependencias
- El proyecto requiere bibliotecas Python como torchynumpyLa lista está en requirements.txt Medio.
- Ejecute el comando para instalar:
```
pip install -r requirements.txt
```
- Si no dispone de este archivo, consulte el LÉAME para instalarlo. diffusersytransformers etc.
Obtener el modelo
- PiT se basa en los modelos IP-Prior e IP-Adapter+, los enlaces de descarga están en GitHub o en el documento (https://arxiv.org/abs/2503.10365).
- Coloca el modelo en el directorio especificado (por ejemplo models/), consulte README para conocer la ruta.
Instalación de SDXL
- PiT renderiza imágenes con SDXL. Instalación diffusers::
```
pip install diffusers
```
- Descarga el modelo SDXL de Hugging Face y guárdalo localmente.

Utilización

Preparar las piezas
- Se recomienda recopilar partes de imágenes (por ejemplo, orejas, logotipos) en formato PNG con un fondo limpio.
- En la carpeta de entrada del proyecto (por ejemplo input/).
programa de carrera
- Introduzca el directorio PiT en el terminal.
- Ejecute el script (suponiendo que generate.py(consulte el archivo README para obtener más información):
```
python generate.py --input_dir input/ --output_dir output/
```
- Descripción de los parámetros:
  - --input_dirCarpeta de piezas.
  - --output_dir: Los resultados se guardan en la carpeta.
- El programa genera la imagen completa con la pieza.
Ver la imagen
- Después de generar, abra el output/ Vista de carpetas.
- Si no está satisfecho, añada más piezas o cambie la imagen clara.

Función destacada Operación

Número de piezas
Puede introducir 1 o más partes. Por ejemplo, introduzca "pata" y "cola" para generar un animal completo. Es mejor tener el mismo estilo de partes.
estilismo
Las señales de estilo pueden añadirse con IP-LoRA. Ejemplo:
```
python generate.py --input_dir input/ --output_dir output/ --prompt "卡通风格"
```
Así es posible generar imágenes caricaturescas.
(matem.) modelo de dominio conmutativo
PiT admite diferentes modelos de IP-Prior (por ejemplo, juguetes, criaturas). El archivo de modelo correspondiente se carga al cambiar, ver README para el funcionamiento.
Resultados de la optimización
Si la imagen es borrosa, compruebe si la parte es clara o añada parámetros:
```
python generate.py --input_dir input/ --steps 50
```

advertencia

Las piezas deben ser claras y evitar ser demasiado pequeñas o recargadas.
La primera carrera es lenta, las siguientes serán rápidas.
En caso de error, instale las bibliotecas que faltan.

Estos pasos le ayudarán a montar una imagen completa con PiT. La operación requiere programación, pero el proceso es sencillo.

escenario de aplicación

Inspiración en el diseño
Los diseñadores introducen piezas (por ejemplo, alas, sombreros) para componer personajes completos y probar ideas rápidamente.
Concepto de producto
Los desarrolladores utilizan piezas (por ejemplo, botones, formas) para generar nuevas imágenes de productos y explorar direcciones de diseño.
Aprendizaje técnico
Los investigadores utilizaron PiT para probar cómo la IA puede desconcertar a partir de piezas para comprender los principios de la generación de imágenes.

CONTROL DE CALIDAD

¿Cuál es la diferencia entre PiT y otras herramientas?
PiT es un puzzle directo con piezas de imagen, sin texto, adecuado para la creación visual.
¿Hay que entrenar el modelo?
No es necesario, hay modelos oficiales preentrenados, pero puedes entrenarlos y ajustarlos tú mismo.
¿Es rápido de generar?
No es rápido, tarda de unos segundos a unos minutos dependiendo del dispositivo.

Últimos recursos sobre IA # Editor de imágenes AI # AI Control de estilo de imagen # AI Java Proyecto de código abierto

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Anubis: Interferir en el rastreo de rastreadores de IA mediante pruebas de cargas de trabajo

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 11 meses

066.6K

Cyberwriting: plataforma de escritura basada en IA para instrumentos y ensayos modelo, con una enorme cantidad de material instrumental.

Últimos recursos sobre IA # AI Escritura

hace 1 año

045.8K

Hadas - Agente de IA de propósito general con potentes capacidades multitarea

Últimos recursos sobre IA

hace 9 meses

048.9K

R1-Omni: un modelo de código abierto para analizar emociones a través de vídeo y audio

Últimos recursos sobre IA # AI Java Proyecto de código abierto

hace 1 año

053.2K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

PiT: herramienta para unir imágenes completas a partir de partes de imágenes (no abierta)

Introducción general

Lista de funciones