PSHuman：生成逼真3D人像模型，使用一张照片生成3D人建模

63.8K 00

综合介绍

PSHuman是一个基于多视图扩散技术的单图像3D人像重建工具。该工具能够从单张穿衣人像照片生成详细的几何结构和逼真的3D人像模型。PSHuman的核心技术包括跨尺度多视图扩散，能够在短时间内生成高质量的3D人像。该项目由pengHTYX团队开发，旨在为用户提供一个高效、易用的3D人像建模解决方案。

功能列表

单图像3D人像重建：从单张人像照片生成详细的3D模型。
多视图扩散技术：利用跨尺度多视图扩散技术生成高质量的3D人像。
SMPL-free版本：无需SMPL条件即可进行多视图生成，适用于一般姿态的人像。
背景移除：支持使用Clipdrop或rembg工具移除背景。
结构化输出：生成的3D模型和渲染视频以结构化文件形式保存，便于查看和分享。

使用帮助

安装流程

创建虚拟环境并安装依赖：

$ conda create -n pshuman python=3.10
$ conda activate pshuman
$ pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu121
$ pip install kaolin==0.17.0 -f https://nvidia-kaolin.s3.us-east-2.amazonaws.com/torch-2.1.0_cu121.html
$ pip install -r requirements.txt

配置相关模型：
- 下载ECON和SIFU相关模型，并将其重新组织到项目中。

使用流程

背景移除：使用Clipdrop或rembg工具移除人像照片的背景。对于rembg工具，可以运行以下脚本：
```
$ python utils/remove_bg.py --path $DATA_PATH$
```
将生成的RGBA图像放入目录中。

运行推理：通过运行inference.py脚本生成纹理网格和渲染视频：

$ CUDA_VISIBLE_DEVICES=$GPU python inference.py --config configs/inference-768-6view.yaml \
pretrained_model_name_or_path='pengHTYX/PSHuman_Unclip_768_6views' \
validation_dataset.crop_size=740 \
with_smpl=false \
validation_dataset.root_dir=$DATA_PATH$ \
seed=600 \
num_views=7 \
save_mode='rgb'