ChatAnyone: 사진으로 반신 디지털 인물 동영상을 생성하는 도구

60.1K 00

일반 소개

채팅애니원은 HumanAIGC 팀이 개발한 혁신적인 프로젝트입니다. 인공지능 기술을 사용하여 한 장의 사진과 오디오 입력으로 상체 움직임이 포함된 디지털 인물 동영상을 생성합니다. 이 프로젝트는 계층적 모션 확산 모델을 기반으로 아바타를 표현하거나 디지털 인물 애니메이션에 적합한 머리 움직임, 제스처, 표정을 생성하며, 512×768 해상도와 초당 30프레임의 비디오 출력을 지원하는 효율적인 생성 기능을 갖추고 있습니다. 이 프로젝트는 현재 깃허브에서 기술적 세부 사항을 공개하고 있지만 아직 완전한 오픈소스는 아니기 때문에 디지털 휴먼 생성 기술에 관심이 있는 많은 사용자의 관심을 받고 있습니다.

기능 목록

사진 생성 비디오사진 한 장과 오디오 입력으로 상체 움직임이 포함된 디지털 휴먼 비디오를 생성합니다.
모션 제어머리의 자연스러운 움직임, 제스처 및 표정 생성을 지원합니다.
오디오 동기화입술 움직임이 오디오와 일치하여 사실감을 높입니다.
고성능4090 GPU에서 초당 30프레임으로 512×768 해상도를 지원합니다.
기술 쇼케이스사용자가 학습하고 탐색할 수 있도록 GitHub 페이지를 통해 결과를 공유하세요.

도움말 사용

ChatAnyone은 현재 기술 데모 프로젝트이며 완전한 오픈소스가 아니므로 직접 다운로드하거나 설치할 수 없습니다. 다음 콘텐츠는 공식 정보를 기반으로 하며, 사용자가 프로젝트에 대한 이해를 돕고 향후 공개 사용을 기대할 수 있도록 기능과 운영 로직을 자세히 설명합니다.

주요 기능

1. 사진으로 동영상 생성하기

운영 로직사용자가 인물 사진과 오디오(예: 말하거나 노래하는 녹음)를 제공하면 시스템에서 상체 움직임이 있는 디지털 인물의 동영상을 생성합니다. 동영상에는 고개 돌리기, 제스처 등의 움직임이 포함됩니다.
효과초당 30프레임의 프레임 속도로 최대 512 x 768의 비디오 해상도를 출력합니다. 디지털 사람의 움직임이 오디오 템포에 맞춰져 가상 이미지를 표시하는 데 적합합니다.
사용법해당 기능은 현재 공식 데모 동영상이나 문서를 통해 알려져 있으며, 향후 베타 버전이 오픈될 수 있습니다.

2. 이동 제어

운영 로직머리와 손의 역학을 포함한 오디오를 기반으로 자연스러운 상체 움직임을 생성합니다. 사용자는 예제를 통해 동작 범위에 대해 배울 수 있습니다.
효과: 생성된 디지털 인물은 끄덕이거나 제스처를 바꾸는 등 다양한 움직임 스타일을 표현하여 표현력을 높일 수 있습니다.
사용법이 기능은 데모 단계에 있으며, 사용자는 GitHub 페이지를 통해 작동 방식을 확인할 수 있습니다.

3. 오디오 동기화

운영 로직선명한 오디오를 입력하면 시스템이 소리의 리듬에 맞는 입술 움직임을 생성합니다.
효과입술은 가상 앵커 또는 애니메이션 프레젠테이션을 위해 오디오와 고도로 동기화됩니다.
사용법현재 공식 샘플 영상을 통해 체험할 수 있으며, 향후 사용자 테스트가 지원될 수 있습니다.

자세한 정보를 얻는 방법

공식 페이지 방문하기바로가기 https://github.com/HumanAIGC/chat-anyone를 클릭하고 프로젝트 설명 및 프레젠테이션 동영상을 확인하세요.
업데이트 팔로우이 프로젝트는 아직 오픈소스가 아니지만 향후 팀에서 코드나 도구를 공개할 수 있습니다. GitHub 리포지토리를 정기적으로 확인하는 것이 좋습니다.
팀에 문의자세한 내용은 GitHub에 메시지를 남기거나 공식 연락처 정보를 참조하세요.

주의

ChatAnyone은 현재 기술 데모 프로젝트이므로 직접 사용할 수 없습니다.
세대에는 고성능 하드웨어(예: 4090 GPU)가 필요하므로 일반 사용자가 로컬에서 경험하기는 어렵습니다.
이 프로젝트는 향후 오픈소스로 공개될 수 있으며, 그때 자세한 가이드가 제공될 예정입니다.

애플리케이션 시나리오

가상 이미지 프레젠테이션
사용자는 사진으로 디지털 인물의 동영상을 생성하여 개인화된 가상 이미지를 보여줄 수 있습니다.
애니메이션 콘텐츠 제작
크리에이터는 생성된 반인반수의 디지털 인물 영상을 사용하여 단편 영화나 프레젠테이션 콘텐츠를 제작할 수 있습니다.
기술 연구
연구자들은 이 프로젝트를 통해 오디오 기반 디지털 휴먼 생성 기술에 대해 배울 수 있습니다.

QA

ChatAnyone은 실시간으로 채팅할 수 있나요?
현재는 없습니다. 라이브 채팅 도구가 아닌 사진 및 오디오로 동영상을 생성하는 데 중점을 두고 있습니다.
어떤 유형의 사진이 지원되나요?
공식 프레젠테이션은 인물 사진을 기반으로 하며, 구체적인 요구 사항은 향후 문서에서 확인할 수 있습니다.
동영상을 상업적으로 사용할 수 있나요?
현재 명시적인 라이선스가 없으므로 오픈소스에서 계약서를 볼 때까지 기다려야 합니다.