TRELLIS: 다양한 포맷 지원 및 유연한 편집 기능을 갖춘 Microsoft에서 개발한 3D 에셋 생성 모델입니다.

최신 AI 리소스8개월 전 업데이트 AI 공유 서클
3.4K 00

일반 소개

TRELLIS는 Microsoft에서 개발한 대규모 3D 에셋 생성 모델입니다. 텍스트 또는 이미지 단서를 수신하고 방사형 필드, 3D 가우시안, 메시 등 다양한 형식의 고품질 3D 에셋을 생성할 수 있으며, TRELLIS의 핵심은 통합 SLAT(구조화된 잠재 변수) 표현으로, 다양한 출력 형식으로 디코딩할 수 있고 SLAT용으로 특별히 설계된 정류기 흐름 변압기의 견고성을 통해 뒷받침됩니다. 50만 개의 다양한 오브젝트가 포함된 대규모 3D 자산 데이터세트로 사전 학습된 이 모델은 기존 방식보다 훨씬 뛰어난 성능을 발휘하며 유연한 출력 포맷 선택과 네이티브 3D 편집 기능을 보여줍니다.

TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

 

기능 목록

  • 고품질 생성: 복잡한 모양과 텍스처 디테일이 포함된 다양한 3D 에셋을 생성합니다.
  • 다용도성: 텍스트 또는 이미지 프롬프트를 수신하여 방사형 필드, 3D 가우시안, 메시 등 다양한 3D 표현을 생성합니다.
  • 유연한 편집: 생성된 3D 에셋을 쉽게 편집할 수 있습니다(예: 동일한 오브젝트의 변형 생성 또는 3D 에셋의 로컬 편집).

 

도움말 사용

설치 프로세스

  1. 전제 조건::
    • Linux에서 코드를 실행하는 것이 권장되며 다른 플랫폼에서는 테스트되지 않았습니다.
    • 종속성 관리에는 Conda를 사용하는 것이 좋습니다.
    • Python 3.8 이상이 필요합니다.
    • 16GB 이상의 RAM이 장착된 NVIDIA GPU가 필요하며, 코드는 NVIDIA A100 및 A6000 GPU에서 테스트되었습니다.
    • 특정 하위 모듈을 컴파일하려면 CUDA 툴킷이 필요하며, 코드는 CUDA 11.8 및 12.2에서 테스트되었습니다.
  2. 설치 단계::
    • 리포지토리 복제하기:
      git clone --recurse-submodules https://github.com/microsoft/TRELLIS.git
      cd TRELLIS
      
    • 종속성을 설치합니다:
      . ./setup.sh --new-env --basic --xformers --flash-attn --diffoctreerast --spconv --mipgaussian --kaolin --nvdiffrast
      

사용 프로세스

  1. 사전 학습된 모델 로드::
    from trellis.pipelines import TrellisImageTo3DPipeline
    pipeline = TrellisImageTo3DPipeline.from_pretrained("JeffreyXiang/TRELLIS-image-large")
    pipeline.cuda()
    
  2. 이미지 로드 및 파이프라인 실행::
    from PIL import Image
    image = Image.open("assets/example_image/T.png")
    outputs = pipeline.run(image, seed=1)
    
  3. 렌더링 출력::
    from trellis.utils import render_utils
    video = render_utils.render_video(outputs['gaussian'][0])['color']
    
  4. 결과 저장::
    import imageio
    imageio.mimsave("sample_gs.mp4", video, fps=30)
    
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...