Aprendizagem pessoal com IA
e orientação prática

TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Introdução geral

O TRELLIS é um modelo de geração de ativos 3D em grande escala desenvolvido pela Microsoft. Ele é capaz de receber dicas de texto ou imagem e gerar ativos 3D de alta qualidade em vários formatos, como campos radiais, Gaussianas 3D e malhas. No centro do TRELLIS está uma representação unificada de Variável Latente Estruturada (SLAT), que permite que ele seja decodificado em diferentes formatos de saída e é apoiado pela robustez dos transformadores de fluxo retificador projetados especificamente para SLAT. Pré-treinado em um grande conjunto de dados de ativos 3D contendo 500.000 objetos diversos, o modelo supera significativamente os métodos existentes, demonstrando a seleção flexível do formato de saída e os recursos nativos de edição 3D.

TRELLIS: Modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível-1


 

Lista de funções

  • Geração de alta qualidade: gere diversos ativos 3D com detalhes complexos de forma e textura.
  • Versatilidade: Receba solicitações de texto ou imagem para gerar uma variedade de representações em 3D, incluindo campos de radiação, Gaussianas 3D e malhas.
  • Edição flexível: permite a edição fácil de ativos 3D gerados, como a geração de variantes do mesmo objeto ou a edição local de ativos 3D.

 

Usando a Ajuda

Processo de instalação

  1. condição prévia::
    • Recomendado para executar o código no Linux, não testado em outras plataformas.
    • O Conda é recomendado para gerenciar dependências.
    • Requer Python 3.8 ou superior.
    • Requer uma GPU NVIDIA com 16 GB ou mais de RAM; o código foi testado nas GPUs NVIDIA A100 e A6000.
    • Requer o kit de ferramentas CUDA para compilar determinados submódulos; o código foi testado no CUDA 11.8 e 12.2.
  2. Etapas de instalação::
    • Clonagem do repositório:
      git clone --recurse-submodules https://github.com/microsoft/TRELLIS.git
      cd TRELLIS
      
    • Instalar dependências:
      . . /setup.sh --new-env --basic --xformers --flash-attn --diffoctreerast --spconv --mipgaussian --kaolin --nvdiffrast
      

Processo de uso

  1. Carregamento de modelos pré-treinados::
    from trellis.pipelines import TrellisImageTo3DPipeline
    pipeline = TrellisImageTo3DPipeline.from_pretrained("JeffreyXiang/TRELLIS-image-large")
    pipeline.cuda()
    
  2. Carregue a imagem e execute o pipeline::
    from PIL import Image
    image = Image.open("assets/example_image/T.png")
    outputs = pipeline.run(image, seed=1)
    
  3. saída de renderização::
    from trellis.utils import render_utils
    video = render_utils.render_video(outputs['gaussian'][0])['colour']
    
  4. Salvar resultados::
    importar imageio
    imageio.mimsave("sample_gs.mp4", video, fps=30)
    
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil