혼합 세계 모델 1.1 - 텐센트 혼합 세계, 오픈 소스 3D 재구성 대형 모델 출시

최신 AI 리소스23시간 전에 게시 됨 AI 공유 서클
2.5K 00
堆友AI

하이브리드 월드 모델 1.1이란 무엇인가요?

월드미러 1.1(월드미러)은 텐센트 월드미러 팀이 출시한 오픈소스 3D 재구성 모델로, 월드미러 시리즈의 업그레이드 버전입니다. 멀티뷰 이미지, 동영상, 카메라 위치, 내부 참조, 깊이 맵 등의 멀티모달 선험적 입력을 지원하며, 단일 이미지에만 의존하는 기존 3D 재구성의 한계를 극복하고 동적 선험적 주입 메커니즘을 통해 다양한 입력 조합에 유연하게 적응할 수 있는 것이 특징입니다. 포인트 클라우드, 멀티뷰 심도 맵, 카메라 파라미터, 표면 법선 및 3D 가우시안 포인트 등 여러 3D 기하학적 예측을 동시에 생성할 수 있는 엔드투엔드 멀티태스크 통합 출력을 최초로 달성했으며, 엔드투엔드 협업 훈련을 통해 재구성 품질과 기하학적 일관성을 향상시켰습니다.

混元世界模型1.1 - 腾讯混元发布的开源3D重建大模型

하이브리드 월드 모델 1.1의 기능적 특징

  • 멀티모달 입력 지원멀티뷰 이미지, 동영상 등 다양한 입력 방식을 지원하며 다양한 유형의 입력 데이터를 유연하게 처리할 수 있습니다.
  • 멀티태스킹 통합 출력포인트 클라우드, 심도 맵, 카메라 파라미터, 표면 법선, 3D 가우시안 포인트 등 다양한 3D 기하학적 예측을 동시에 출력하여 다양한 요구 사항을 충족할 수 있습니다.
  • 초 단위 추론으로 단일 카드 배포순수 피드 포워드 아키텍처를 사용하여 단일 그래픽 카드에 배포할 수 있으며 8-32개의 뷰 입력을 처리하는 데 로컬에서 1초밖에 걸리지 않아 2단계 추론이 가능합니다.
  • 유연한 선험적 적응성동적 선험적 주입 메커니즘을 통해 모델은 선험적 조합에 유연하게 적응할 수 있으며, 선험적 입력 없이도 3D 재구성을 수행할 수 있습니다.
  • 강력한 일반화 기능코스 학습 전략의 도움으로 단일 이미지 분포를 넘어 일반화할 수 있는 모델의 능력이 극대화되어 다양한 입력 데이터를 더 잘 처리할 수 있습니다.
  • 고정밀 3D 재구성3D 포인트 클라우드 재구성 및 엔드투엔드 3DGS 재구성에서 뛰어난 성능을 발휘하며, 기하학적 정확도와 디테일 재현이 뛰어나 고품질 3D 콘텐츠 제작을 지원합니다.

하이브리드 월드 모델의 핵심 이점 1.1

  • 멀티모달 입력의 유연한 처리카메라 포즈, 내부 참조, 깊이 맵 등과 같은 멀티 모달 선험적 정보 주입을 지원하고 계층적 코딩 전략을 통해 전역 및 로컬 기하학적 제약 조건을 융합하여 임의의 선험적 조합에 적응함으로써 재구성 품질과 견고성을 개선합니다.
  • 일반 3D 시각적 예측포인트 클라우드, 뎁스 맵, 카메라 파라미터, 표면 노멀, 3D 가우시안 포인트 등의 통합 멀티태스크 출력, 엔드투엔드 협업 훈련을 통해 기하학적 정확도와 디테일 재현을 최적화하고 고품질 메시 재구성 및 실시간 새로운 시점 렌더링을 최초로 지원했습니다.
  • 초 단위 추론을 통한 효율적인 단일 카드 배포단 한 번의 순방향 전파로 3D 속성을 출력하고 8-32개의 뷰 입력을 단 1초 만에 처리할 수 있는 순수 피드 포워드 아키텍처를 채택하여 기존의 반복적 최적화 방식보다 훨씬 뛰어나 하드웨어의 문턱을 낮추고 누구나 사용할 수 있는 3D 재구성 기술을 실현했습니다.
  • 씬 간 일반화 기능코스 학습 전략(작업 순서, 데이터 스케줄링, 해상도 진행)을 통해 훈련을 최적화하여 실제 사진 및 AI 생성 비디오와 같은 다양한 입력에 대한 적응력을 향상시켜 잘 구조화되고 디테일이 풍부한 장면을 생성합니다.
  • 오픈 소스 및 사용 편의성완전 오픈 소스, 로컬 배포 문서 및 Hugging Face 온라인 데모 제공, 3D 재구성 결과의 멀티뷰 이미지 또는 비디오 실시간 미리보기 업로드 지원, 기술 애플리케이션의 문턱을 낮춥니다.

하이브리드 월드 모델 1.1의 공식 웹사이트는 무엇인가요?

  • 프로젝트 웹사이트:: https://3d-models.hunyuan.tencent.com/world/
  • 깃허브 리포지토리:: https://github.com/Tencent-Hunyuan/HunyuanWorld-Mirror
  • 포옹하는 얼굴 모델 라이브러리:: https://huggingface.co/tencent/HunyuanWorld-Mirror
  • 허깅페이스 온라인 데모:: https://huggingface.co/spaces/tencent/HunyuanWorld-Mirror
  • 기술 보고서:: https://3d-models.hunyuan.tencent.com/world/worldMirror1_0/HYWorld_Mirror_Tech_Report.pdf

하이브리드 세계 모델 1.1을 위한 사람들

  • 3D 콘텐츠 제작자게임 개발, VR 체험, 영화 및 TV 제작 등을 위한 고품질 3D 씬을 빠르게 생성하여 크리에이터가 가상 세계를 효율적으로 구축할 수 있도록 지원합니다.
  • 교육자 및 학생가상 실험실 및 역사적 장면 재현과 같은 교육 시나리오의 학습 경험과 효과를 높이기 위해 몰입형 3D 교육 환경을 만드는 데 사용할 수 있습니다.
  • 산업 디자이너 및 엔지니어제품 설계, 가상 조립 및 물리적 시뮬레이션을 지원하여 산업 설계 프로세스를 가속화하고 설계 효율성과 품질을 개선합니다.
  • 문화유산 보존가고대 건물과 문화 유적을 고정밀 3D로 복원하여 문화유산의 디지털 보존과 연구를 지원합니다.
  • 부동산 개발자 및 건축가건축 설계 프레젠테이션, 가상 쇼룸 등을 위한 3D 모델과 건물 가상 투어를 생성하여 사용자 경험을 향상시킵니다.
  • 광고 및 마케팅 직원제품 데모, 가상 쇼룸 등 매력적인 3D 광고 콘텐츠를 제작하여 광고의 인터랙티브함과 호소력을 높일 수 있습니다.
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...