PSHuman: Erzeugen realistischer 3D-Porträtmodelle, Verwendung eines Fotos zur Erzeugung von 3D-Menschenmodellen

Neueste AI-RessourcenGeschrieben vor 8 Monaten AI-Austauschkreis

2.4K 00

Allgemeine Einführung

PSHuman ist ein Einzelbild-3D-Porträt-Rekonstruktionstool, das auf der Multi-View-Diffusionstechnologie basiert. Das Tool ist in der Lage, detaillierte geometrische Strukturen und realistische 3D-Porträtmodelle aus einem einzigen Foto einer bekleideten Person zu generieren. Die Kerntechnologie von PSHuman umfasst die skalenübergreifende Multiview-Diffusion, die in der Lage ist, hochwertige 3D-Porträts in kurzer Zeit zu erzeugen. Das vom pengHTYX-Team entwickelte Projekt zielt darauf ab, den Benutzern eine effiziente und einfach zu bedienende Lösung für die 3D-Porträtmodellierung zu bieten.

Funktionsliste

Einzelbild-3D-Porträt-Rekonstruktion: Generieren Sie detaillierte 3D-Modelle aus einzelnen Porträtfotos.
Multi-View-Diffusion: Erzeugen Sie hochwertige 3D-Porträts mit skalenübergreifender Multi-View-Diffusion.
SMPL-freie Version: Multiview-Generierung ohne SMPL-Bedingung, geeignet für allgemeine Posenporträts.
Entfernen des Hintergrunds: Unterstützung für das Entfernen des Hintergrunds mit Clipdrop oder rembg tool.
Strukturierte Ausgabe: Erstellte 3D-Modelle und gerenderte Videos werden als strukturierte Dateien gespeichert, um die Anzeige und Weitergabe zu erleichtern.

Hilfe verwenden

Einbauverfahren

Erstellen Sie eine virtuelle Umgebung und installieren Sie die Abhängigkeiten:

$ conda create -n pshuman python=3.10
$ conda activate pshuman
$ pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu121
$ pip install kaolin==0.17.0 -f https://nvidia-kaolin.s3.us-east-2.amazonaws.com/torch-2.1.0_cu121.html
$ pip install -r requirements.txt

Konfigurieren Sie das zugehörige Modell:
- Laden Sie ECON- und SIFU-bezogene Modelle herunter und organisieren Sie sie in Projekten neu.

Verwendungsprozess

Entfernung des Hintergrunds: Entfernen Sie den Hintergrund eines Porträtfotos mit dem Werkzeug Clipdrop oder rembg. Für das rembg-Werkzeug können Sie das folgende Skript ausführen:
```
$ python utils/remove_bg.py --path $DATA_PATH$
```
Legen Sie das erzeugte RGBA-Bild in die Datei Katalog.

logische SchlussfolgerungGenerieren Sie das Texturnetz und rendern Sie das Video, indem Sie das Skript inference.py ausführen:

$ CUDA_VISIBLE_DEVICES=$GPU python inference.py --config configs/inference-768-6view.yaml \
pretrained_model_name_or_path='pengHTYX/PSHuman_Unclip_768_6views' \
validation_dataset.crop_size=740 \
with_smpl=false \
validation_dataset.root_dir=$DATA_PATH$ \
seed=600 \
num_views=7 \
save_mode='rgb'

Anpassungsparametercrop_size (720 oder 740) und seed (42 oder 600) nach Bedarf anpassen, um beste Ergebnisse zu erzielen.

Hauptfunktionen

Einzelbild 3D-Portrait-RekonstruktionDer Benutzer stellt ein Porträtfoto zur Verfügung und das System erstellt automatisch ein detailliertes 3D-Modell.
Mehransichtige DiffusionstechnikGenerierung hochwertiger 3D-Porträts mit skalenübergreifenden Multiview-Diffusionstechniken.
Entfernung des HintergrundsUnterstützung für das Entfernen von Hintergründen mit den Werkzeugen Clipdrop oder rembg, um die Weiterverarbeitung zu vereinfachen.
Strukturierte AusgabeGenerierte 3D-Modelle und gerenderte Videos werden als strukturierte Dateien gespeichert und können so leicht betrachtet und weitergegeben werden.

Detaillierte Vorgehensweise

Porträtfotos zur Verfügung stellenDer Benutzer stellt ein Porträtfoto zur Verfügung und bearbeitet es mit einem Werkzeug zur Hintergrundentfernung.
Ausführen von InferenzskriptenGenerieren von 3D-Modellen und Rendern von Videos durch Ausführen des Skripts inference.py.
Anpassungsparameter: Passen Sie die Parameter im Inferenzskript nach Bedarf an, um die besten Ergebnisse zu erzielen.
Ansehen und TeilenDie generierten 3D-Modelle und gerenderten Videos werden als strukturierte Dateien gespeichert, die von den Nutzern direkt betrachtet und weitergegeben werden können.

Neueste AI-Ressourcen # AI Text und Bild in 3D

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Keling AI: KI-Tool zur Erstellung kreativer Bilder und Videos von Shutterstock vorgestellt

Neueste AI-Ressourcen # AI Bild zu Video # AI Online-Bilderzeugung # AI Gesichtstausch und Verkleidung

vor 8 Monaten

04.1K

SUDOAI: Kostenloses und einfach zu bedienendes Tool zur Umwandlung von Text oder Bild in 3D-Modelle

Neueste AI-Ressourcen # AI Text und Bild in 3D

vor 9 Monaten

02.9K

Blotato: KI generiert schnell populäre Beiträge und Werbevideos (bezahlt)

Neueste AI-Ressourcen # AI Soziale Medien # AI Marketing

vor 5 Monaten

02.9K

Pika: Exzellente kreative Videoerstellung | Text zu Video | Grafik zu Video | Bild zu Video Fusion

Neueste AI-Ressourcen # AI Bild zu Video # AI Text zu Video

vor 2 Monaten

03.2K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

PSHuman: Erzeugen realistischer 3D-Porträtmodelle, Verwendung eines Fotos zur Erzeugung von 3D-Menschenmodellen

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Verwendungsprozess

Hauptfunktionen

Detaillierte Vorgehensweise

Report mAIstro: Erstellen Sie detaillierte Berichte zu jedem beliebigen Thema, z. B. Geschäftsanalysen, Jahresendberichte usw.

GLM-PC (Smart Spectrum Bull) ist offiziell zum internen Download freigegeben, die KI, die wirklich den Computer steuern kann

Ähnliche Artikel

Keling AI: KI-Tool zur Erstellung kreativer Bilder und Videos von Shutterstock vorgestellt

SUDOAI: Kostenloses und einfach zu bedienendes Tool zur Umwandlung von Text oder Bild in 3D-Modelle

Blotato: KI generiert schnell populäre Beiträge und Werbevideos (bezahlt)

Pika: Exzellente kreative Videoerstellung | Text zu Video | Grafik zu Video | Bild zu Video Fusion

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

PSHuman: Erzeugen realistischer 3D-Porträtmodelle, Verwendung eines Fotos zur Erzeugung von 3D-Menschenmodellen

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Verwendungsprozess

Hauptfunktionen

Detaillierte Vorgehensweise

Report mAIstro: Erstellen Sie detaillierte Berichte zu jedem beliebigen Thema, z. B. Geschäftsanalysen, Jahresendberichte usw.

GLM-PC (Smart Spectrum Bull) ist offiziell zum internen Download freigegeben, die KI, die wirklich den Computer steuern kann

Ähnliche Artikel

Keling AI: KI-Tool zur Erstellung kreativer Bilder und Videos von Shutterstock vorgestellt

SUDOAI: Kostenloses und einfach zu bedienendes Tool zur Umwandlung von Text oder Bild in 3D-Modelle

Blotato: KI generiert schnell populäre Beiträge und Werbevideos (bezahlt)

Pika: Exzellente kreative Videoerstellung | Text zu Video | Grafik zu Video | Bild zu Video Fusion

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel