AI Personal Learning
und praktische Anleitung

PSHuman: Erzeugen realistischer 3D-Porträtmodelle, Verwendung eines Fotos zur Erzeugung von 3D-Menschenmodellen

Allgemeine Einführung

PSHuman ist ein Einzelbild-3D-Porträt-Rekonstruktionstool, das auf der Multi-View-Diffusionstechnologie basiert. Das Tool ist in der Lage, detaillierte geometrische Strukturen und realistische 3D-Porträtmodelle aus einem einzigen Foto einer bekleideten Person zu generieren. Die Kerntechnologie von PSHuman umfasst die skalenübergreifende Multiview-Diffusion, die in der Lage ist, hochwertige 3D-Porträts in kurzer Zeit zu erzeugen. Das vom pengHTYX-Team entwickelte Projekt zielt darauf ab, den Nutzern eine effiziente und einfach zu bedienende Lösung für die 3D-Porträtmodellierung zu bieten.

PSHuman: Erzeugen realistischer 3D-Porträtmodelle, Verwendung eines Fotos zur Erzeugung von 3D-Menschenmodellen-1


 

Funktionsliste

  • Einzelbild-3D-Porträt-Rekonstruktion: Generieren Sie detaillierte 3D-Modelle aus einzelnen Porträtfotos.
  • Multi-View-Diffusion: Erzeugen Sie hochwertige 3D-Porträts mit skalenübergreifender Multi-View-Diffusion.
  • SMPL-freie Version: Multiview-Generierung ohne SMPL-Bedingung, geeignet für allgemeine Posenporträts.
  • Entfernen des Hintergrunds: Unterstützung für das Entfernen des Hintergrunds mit Clipdrop oder rembg tool.
  • Strukturierte Ausgabe: Erstellte 3D-Modelle und gerenderte Videos werden als strukturierte Dateien gespeichert, um die Anzeige und Weitergabe zu erleichtern.

 

Hilfe verwenden

Ablauf der Installation

  1. Erstellen Sie eine virtuelle Umgebung und installieren Sie die Abhängigkeiten:
    $ conda create -n pshuman python=3.10
    $ conda activate pshuman
    $ pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu121
    $ pip install kaolin==0.17.0 -f https://nvidia-kaolin.s3.us-east-2.amazonaws.com/torch-2.1.0_cu121.html
    $ pip install -r anforderungen.txt
    
  2. Konfigurieren Sie das zugehörige Modell:
    • Laden Sie ECON- und SIFU-bezogene Modelle herunter und organisieren Sie sie in Projekten neu.

Verwendung Prozess

  1. Entfernung des Hintergrunds: Entfernen Sie den Hintergrund eines Porträtfotos mit dem Werkzeug Clipdrop oder rembg. Für das rembg-Werkzeug können Sie das folgende Skript ausführen:
    $ python utils/remove_bg.py --path $DATA_PATH$
    

    Legen Sie das erzeugte RGBA-Bild in die Datei blank Katalog.

  2. logische SchlussfolgerungenGenerieren Sie das Texturnetz und rendern Sie das Video, indem Sie das Skript inference.py ausführen:
    $ CUDA_VISIBLE_DEVICES=$GPU python inference.py --config configs/inference-768-6view.yaml \
    pretrained_model_name_or_path='pengHTYX/PSHuman_Unclip_768_6views' \
    validation_dataset.crop_size=740 \
    with_smpl=false \
    validation_dataset.root_dir=$DATA_PATH$ \
    seed=600 \
    num_views=7 \
    save_mode='rgb'
    
  3. Anpassungsparametercrop_size (720 oder 740) und seed (42 oder 600) nach Bedarf anpassen, um beste Ergebnisse zu erzielen.

Hauptfunktionen

  • Einzelbild 3D-Portrait-RekonstruktionDer Benutzer stellt ein Porträtfoto zur Verfügung und das System erstellt automatisch ein detailliertes 3D-Modell.
  • Mehransichtige DiffusionstechnikGenerierung hochwertiger 3D-Porträts mit skalenübergreifenden Multiview-Diffusionstechniken.
  • Entfernung des HintergrundsUnterstützung für das Entfernen von Hintergründen mit den Werkzeugen Clipdrop oder rembg, um die Weiterverarbeitung zu vereinfachen.
  • Strukturierte AusgabeDie generierten 3D-Modelle und gerenderten Videos werden als strukturierte Dateien gespeichert und können so leicht betrachtet und weitergegeben werden.

Detaillierte Vorgehensweise

  1. Porträtfotos zur Verfügung stellenDer Benutzer stellt ein Porträtfoto zur Verfügung und bearbeitet es mit einem Werkzeug zur Hintergrundentfernung.
  2. Ausführen von InferenzskriptenGenerieren von 3D-Modellen und Rendern von Videos durch Ausführen des Skripts inference.py.
  3. Anpassungsparameter: Passen Sie die Parameter im Inferenzskript nach Bedarf an, um die besten Ergebnisse zu erzielen.
  4. Ansehen und TeilenDie generierten 3D-Modelle und gerenderten Videos werden als strukturierte Dateien gespeichert, die von den Nutzern direkt betrachtet und weitergegeben werden können.
AI Leichtes Lernen

Der Leitfaden für Laien zum Einstieg in die KI

Hilft Ihnen, die Nutzung von KI-Tools kostengünstig und von Null an zu erlernen.KI ist, wie Bürosoftware, eine wesentliche Fähigkeit für jeden. Die Beherrschung von KI verschafft Ihnen einen Vorteil bei der Stellensuche und die Hälfte des Aufwands bei Ihrer zukünftigen Arbeit und Ihrem Studium.

Details ansehen>
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " PSHuman: Erzeugen realistischer 3D-Porträtmodelle, Verwendung eines Fotos zur Erzeugung von 3D-Menschenmodellen

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)