PiT：用图像零件拼出完整图像的工具（未开放）

48.5K 00

综合介绍

PiT（Piece it Together）是一个开源工具，托管在 GitHub 上，由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件，比如翅膀、发型或眼睛，然后用人工智能技术生成一张完整的图像。PiT 不需要文字描述，直接用图片零件作为输入，依靠预训练模型 IP-Prior 补全缺失部分，最后通过 SDXL 渲染出结果。这个工具适合视觉设计师或研究者，用来快速拼凑创意想法。截至 2025 年 3 月 25 日，PiT 的最新代码和说明可在 GitHub 查看。

功能列表

零件拼图：输入零散图像零件，生成一张完整的图像。
细节连贯：根据零件特点，补全的图像保持整体一致。
纯图像输入：不需要文字提示，只用图片就能操作。
多样结果：支持不同数量的零件，生成多种可能图像。
开源项目：代码在 GitHub 上公开，可自由下载和修改。
风格可选：通过 IP-LoRA 调整，支持生成特定风格的图像。
领域适配：可用不同 IP-Prior 模型，生成适合特定主题的图像。

使用帮助

PiT 是 GitHub 上的开源项目，适合有基础编程能力的用户。以下是详细的安装和使用指南，帮助你快速上手。

安装流程

准备环境
- 确保电脑有 Python 3.8 或以上版本。
- 安装 Git（Windows 从 git-scm.com 下载，Mac/Linux 输入 git --version 检查）。
- 推荐使用带 GPU 的设备（如 NVIDIA 显卡加 CUDA），加快生成速度。无 GPU 也能用，但较慢。
下载代码
- 打开终端或命令行。
- 输入命令下载 PiT：
```
git clone https://github.com/eladrich/PiT.git
```
- 进入项目文件夹：
```
cd PiT
```
安装依赖
- 项目需要 Python 库，如 torch、numpy，列表在 requirements.txt 中。
- 运行命令安装：
```
pip install -r requirements.txt
```
- 若无此文件，参考 README 安装 diffusers、transformers 等。
获取模型
- PiT 依赖 IP-Prior 和 IP-Adapter+ 模型，下载链接在 GitHub 或论文（https://arxiv.org/abs/2503.10365）中。
- 将模型放入指定目录（如 models/），路径看 README。
安装 SDXL
- PiT 用 SDXL 渲染图像。安装 diffusers：
```
pip install diffusers
```
- 从 Hugging Face 下载 SDXL 模型，保存到本地。

使用方法

准备零件
- 收集图像零件（如耳朵、标志），建议用 PNG 格式，背景干净。
- 放入项目中的输入文件夹（如 input/）。
运行程序
- 在终端进入 PiT 目录。
- 执行脚本（假设为 generate.py，具体看 README）：
```
python generate.py --input_dir input/ --output_dir output/
```
- 参数说明：
  - --input_dir：零件文件夹。
  - --output_dir：结果保存文件夹。
- 程序会用零件生成完整图像。
查看图像
- 生成后，打开 output/ 文件夹查看。
- 若不满意，可多加零件或换清晰图像。

特色功能操作

零件数量
输入 1 个或多个零件都可以。比如给“爪子”和“尾巴”，生成完整动物。零件风格最好一致。
风格调整
用 IP-LoRA 可加风格提示。例如：
```
python generate.py --input_dir input/ --output_dir output/ --prompt "卡通风格"
```
就能生成卡通化的图像。
换领域模型
PiT 支持不同 IP-Prior 模型（如玩具、生物）。切换时加载对应模型文件，操作看 README。
优化结果
若图像模糊，可检查零件是否清晰，或加参数：
```
python generate.py --input_dir input/ --steps 50
```