PSHuman : Générer des modèles de portrait 3D réalistes, utiliser une photo pour générer une modélisation humaine 3D

Dernières ressources sur l'IAPosté il y a 9 mois Cercle de partage de l'IA

11.8K 00

Introduction générale

PSHuman est un outil de reconstruction de portraits en 3D à partir d'une seule image, basé sur la technologie de diffusion multi-vues. L'outil est capable de générer des structures géométriques détaillées et des modèles de portrait 3D réalistes à partir d'une seule photo d'une personne habillée. La technologie de base de PSHuman comprend la diffusion multi-vues à échelle croisée, qui est capable de générer des portraits 3D de haute qualité dans un court laps de temps. Développé par l'équipe pengHTYX, le projet vise à fournir aux utilisateurs une solution de modélisation de portraits en 3D efficace et facile à utiliser.

Liste des fonctions

Reconstruction de portraits en 3D à partir d'une seule image : générez des modèles 3D détaillés à partir d'une seule photo de portrait.
Diffusion multi-vues : générez des portraits 3D de haute qualité en utilisant la diffusion multi-vues à plusieurs échelles.
Version sans SMPL : génération de vues multiples sans condition SMPL, adaptée aux portraits à pose générale.
Suppression de l'arrière-plan : Prise en charge de la suppression de l'arrière-plan à l'aide de l'outil Clipdrop ou rembg.
Sortie structurée : les modèles 3D générés et les vidéos rendues sont enregistrés sous forme de fichiers structurés pour faciliter la visualisation et le partage.

Utiliser l'aide

Processus d'installation

Créer un environnement virtuel et installer les dépendances :

$ conda create -n pshuman python=3.10
$ conda activate pshuman
$ pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu121
$ pip install kaolin==0.17.0 -f https://nvidia-kaolin.s3.us-east-2.amazonaws.com/torch-2.1.0_cu121.html
$ pip install -r requirements.txt

Configurer le modèle associé :
- Télécharger les modèles ECON et SIFU et les réorganiser en projets.

Processus d'utilisation

Suppression des antécédentsPour la première fois, vous pouvez utiliser l'outil Clipdrop ou l'outil rembg pour supprimer l'arrière-plan d'une photo de portrait. Pour l'outil rembg, vous pouvez exécuter le script suivant :
```
$ python utils/remove_bg.py --path $DATA_PATH$
```
Placez l'image RGBA générée dans le fichier Catalogue.

raisonnement en cours d'exécutionLe programme inference.py permet de générer le maillage de la texture et d'effectuer le rendu de la vidéo :

$ CUDA_VISIBLE_DEVICES=$GPU python inference.py --config configs/inference-768-6view.yaml \
pretrained_model_name_or_path='pengHTYX/PSHuman_Unclip_768_6views' \
validation_dataset.crop_size=740 \
with_smpl=false \
validation_dataset.root_dir=$DATA_PATH$ \
seed=600 \
num_views=7 \
save_mode='rgb'

Paramètres de réglage: Ajustez crop_size (720 ou 740) et seed (42 ou 600) en fonction des besoins pour obtenir les meilleurs résultats.

Principales fonctions

Reconstruction de portraits en 3D à partir d'une seule imageL'utilisateur fournit une photo portrait et le système génère automatiquement un modèle 3D détaillé.
Technique de diffusion multi-vuesLa diffusion de portraits 3D de haute qualité à l'aide de techniques de diffusion multi-vues à échelles croisées.
Suppression des antécédentsSupport pour la suppression des arrière-plans à l'aide des outils Clipdrop ou rembg afin de simplifier le traitement ultérieur.
Sortie structuréeLes modèles 3D générés et les vidéos rendues sont enregistrés sous forme de fichiers structurés pour faciliter la visualisation et le partage.

Procédure d'utilisation détaillée

Fournir des photos de portraitL'utilisateur fournit une photo de portrait et la traite à l'aide d'un outil de suppression de l'arrière-plan.
Exécution de scripts d'inférenceLes modèles 3D et les vidéos de rendu sont générés en exécutant le script inference.py.
Paramètres de réglageLes paramètres du script d'inférence doivent être ajustés en fonction des besoins pour obtenir les meilleurs résultats.
Voir et partagerLes modèles 3D générés et les vidéos rendues sont sauvegardés sous forme de fichiers structurés qui peuvent être directement visualisés et partagés par les utilisateurs.

Dernières ressources sur l'IA # AI Text and Image to 3D (Texte et image en 3D)

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

BoltAI：专为macOS设计的AI助手，集成多种AI服务，适用于开发者和内容创作者

BoltAI : un assistant d'IA conçu pour macOS qui intègre plusieurs services d'IA pour les développeurs et les créateurs de contenu.

Dernières ressources sur l'IA # AI Localised Chat Application

Il y a 9 mois

011.8K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F : Accès gratuit à GPT-4, Llama-3 et à de nombreux autres modèles d'IA via Raycast !

Dernières ressources sur l'IA # AI Java Open Source Projecct # AI Localised Chat Application # Free Large Model API

Il y a 8 mois

012.7K

Uizard : une plateforme de conception d'interface utilisateur alimentée par l'IA

Dernières ressources sur l'IA # AI Page Design

Il y a 11 mois

011.6K

Ogilvy : le rédacteur d'IA qui aide à créer des textes à fort pouvoir de conversion

Dernières ressources sur l'IA # AI Rédaction

il y a 5 mois

011.2K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

PSHuman : Générer des modèles de portrait 3D réalistes, utiliser une photo pour générer une modélisation humaine 3D

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Processus d'utilisation

Principales fonctions

Procédure d'utilisation détaillée

Report mAIstro : génère des rapports détaillés sur n'importe quel sujet personnalisé, tel que l'analyse commerciale, les rapports de fin d'année, etc.

GLM-PC (Smart Spectrum Bull) est officiellement disponible en téléchargement interne, l'IA qui peut réellement contrôler l'ordinateur.

Articles connexes

BoltAI : un assistant d'IA conçu pour macOS qui intègre plusieurs services d'IA pour les développeurs et les créateurs de contenu.

Raycast-G4F : Accès gratuit à GPT-4, Llama-3 et à de nombreux autres modèles d'IA via Raycast !

Uizard : une plateforme de conception d'interface utilisateur alimentée par l'IA

Ogilvy : le rédacteur d'IA qui aide à créer des textes à fort pouvoir de conversion

Pas de commentaires

Dernières collections

Derniers articles

PSHuman : Générer des modèles de portrait 3D réalistes, utiliser une photo pour générer une modélisation humaine 3D

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Processus d'utilisation

Principales fonctions

Procédure d'utilisation détaillée

Report mAIstro : génère des rapports détaillés sur n'importe quel sujet personnalisé, tel que l'analyse commerciale, les rapports de fin d'année, etc.

GLM-PC (Smart Spectrum Bull) est officiellement disponible en téléchargement interne, l'IA qui peut réellement contrôler l'ordinateur.

Articles connexes

BoltAI : un assistant d'IA conçu pour macOS qui intègre plusieurs services d'IA pour les développeurs et les créateurs de contenu.

Raycast-G4F : Accès gratuit à GPT-4, Llama-3 et à de nombreux autres modèles d'IA via Raycast !

Uizard : une plateforme de conception d'interface utilisateur alimentée par l'IA

Ogilvy : le rédacteur d'IA qui aide à créer des textes à fort pouvoir de conversion

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles