Allgemeine Einführung
TripoSR ist ein Open-Source-Modell, das gemeinsam von Tripo AI und Stability AI entwickelt wurde, um schnell hochwertige 3D-Modelle aus einem einzigen Bild zu erzeugen. Das Modell basiert auf der Large Reconstruction Model (LRM)-Architektur und ist in der Lage, 3D-Netze in weniger als 0,5 s zu generieren. TripoSR übertrifft andere Open-Source-Alternativen auf mehreren öffentlich verfügbaren Datensätzen und bietet Geschwindigkeit und Qualität für eine breite Palette von Bereichen, einschließlich Unterhaltung, Spiele, Industriedesign und Architektur.
Zusätzlich zur lokalen Bereitstellung können Sie die offizielle TRIPO-Website besuchen, um unbegrenzt Entwürfe zu erstellen und 10 hochwertige Text-zu-3D- und Bild-zu-3D-Kredite pro Monat zu erhalten.
Funktionsliste
- Schnelle 3D-RekonstruktionGenerieren Sie hochwertige 3D-Modelle aus einem einzigen Bild in nur 0,5 Sekunden.
- Hohe Qualität der AusgabeGenerieren Sie 3D-Modelle mit hoher Auflösung und Detailgenauigkeit.
- offene QuelleVollständiger Quellcode und vortrainierte Modelle werden für Forscher und Entwickler zur Verfügung gestellt.
- Unterstützung mehrerer PlattformenUnterstützt GPU- und CPU-Betrieb für unterschiedliche Hardware-Umgebungen.
- Online-DemoEine Online-Demofunktion ermöglicht es den Nutzern, sich direkt von der Leistungsfähigkeit des Modells zu überzeugen.
Hilfe verwenden
Ablauf der Installation
- Vorbereitung der Umwelt::
- Stellen Sie sicher, dass Python 3.8 oder höher installiert ist.
- Installieren Sie CUDA (falls verfügbar).
- Installieren Sie PyTorch und stellen Sie sicher, dass die lokal installierte Version von CUDA mit der PyTorch-Version übereinstimmt.
- Klonen der Codebasis::
git clone https://github.com/VAST-AI-Research/TripoSR.git cd TripoSR
- Installation von Abhängigkeiten::
pip install -r anforderungen.txt
Verwendung Prozess
- laufendes Beispiel::
python run.py examples/chair.png --output-dir output/
Dies speichert das rekonstruierte 3D-Modell in der
Ausgabe/
Katalog. - Native Gradio-Anwendungen::
python gradio_app.py
Wenn Sie die lokale Gradio-Anwendung starten, können Sie über die Webschnittstelle Bilder hochladen und 3D-Modelle erstellen.
Detaillierte Schritte
- Vorverarbeitung von Bildern::
- Verarbeitet das Eingabebild in ein NumPy-Array.
- Die Merkmale werden mithilfe eines Bildkodierers extrahiert.
- 3D-Rekonstruktion::
- Die extrahierten Merkmale werden in das Bild zum Drei-Ebenen-Decoder eingespeist.
- Vorhersage von Farbe und Dichte mit Hilfe von neuronalen Strahlungsfeldern in drei Ebenen.
- Erzeugung von Output::
- Das erzeugte 3D-Netz kann in einer Vielzahl von Formaten gespeichert werden, um es später einfach zu verwenden und zu bearbeiten.
allgemeine Probleme
- CUDA-FehlerWenn Sie auf CUDA-bezogene Fehler stoßen, stellen Sie sicher, dass die lokal installierte Version von CUDA mit der Version von PyTorch übereinstimmt.
- Installation von Abhängigkeiten fehlgeschlagenStellen Sie sicher, dass Sie die neueste Version von
setuptools
und verwendenpip install --upgrade setuptools
Upgrades durchführen.