EMO: 인물 이미지와 사람의 음성 오디오를 기반으로 고품질 인물 비디오를 생성합니다.

최신 AI 리소스8 개월 전에 게시 됨 AI 공유 서클
2.3K 00

일반 소개

Yummy Portrait EMO는 알리클라우드의 대형 모델 서비스 플랫폼인 Hundred Refine(모델 스튜디오)에서 제공하는 고품질 인물 동적 동영상 생성 도구입니다. 이 도구는 인물 이미지와 사람의 음성 오디오 파일을 기반으로 사실적인 인물 다이나믹 비디오를 생성합니다. 조이풀 포트레이트 이모에는 각각 캐릭터 이미지 준수 감지 및 캐릭터 동영상 생성에 사용되는 '조이풀 포트레이트 이모-감지'와 '조이풀 포트레이트 이모'라는 두 가지 독립 모델이 포함되어 있습니다. 사용자는 간단한 API 호출을 통해 사양을 준수하는 고품질 캐릭터 인물 비디오를 빠르게 생성할 수 있으며, 이는 가상 앵커, 디지털 인물 등 다양한 애플리케이션 시나리오에 적합합니다.

통이 앱에서 무료로 체험해 보세요. 정식 상용화는 API 호출 또는 알리 바이리안 플랫폼에서 자체 배포를 통해 가능합니다.

悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频

 

기능 목록

  • 문자 그림 준수 감지입력 이미지가 사양을 준수하는지 여부를 감지하려면 "EMO-detect" 모델을 사용합니다.
  • 캐릭터 동영상 생성'EMO 초상화' 모델을 사용하여 인물 이미지와 보컬 오디오 파일을 기반으로 동적 비디오를 생성합니다.
  • 다양한 스타일 선택 가능활기차게, 보통, 차분하게 등 다양한 운동 스타일 강도를 지원합니다.
  • API 호출개발자가 쉽게 통합할 수 있도록 사용하기 쉬운 API 인터페이스를 제공합니다.
  • 독립 실행형 배포높은 동시성 요구 사항을 위한 모델 독립적 배포를 지원합니다.

 

도움말 사용

설치 및 구성

  1. 오픈 서비스: 우선, 알리클라우드 플랫폼에서 조이풀 초상화 이모티콘 서비스를 열고 API 키를 받아야 합니다.
  2. API 키 가져오기알리클라우드 계정에 로그인하고 빅 모델 서비스 플랫폼인 Hundred Refine에 들어가서 API 키를 받습니다.

사용 단계

  1. 이미지 감지 모델 호출하기::
    • "EMO 감지" 모델은 입력된 인물 이미지가 사양을 준수하는지 여부를 감지하는 데 사용됩니다.
    • API 호출 예제:
     import requests
    url = "https://api.aliyun.com/emo-detect"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}
    data = {"image": "base64_encoded_image"}
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    
  2. 동영상 생성 모델 호출하기::
    • '맛있는 인물 EMO' 모델을 사용하여 감지된 인물 이미지와 음성 오디오 파일을 입력하면 모션 비디오를 생성할 수 있습니다.
    • API 호출 예제:
     import requests
    url = "https://api.aliyun.com/emo"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}
    data = {
    "image": "base64_encoded_image",
    "audio": "base64_encoded_audio",
    "style_level": "active"
    }
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    

독립 실행형 배포

  1. 리소스 구매: AliCloud 플랫폼에서 독점 인스턴스 리소스를 구매합니다.
  2. 배포 모델: 각각 "EMO-detect-deployment" 및 "EMO-deployment" 모델을 배포합니다.
  3. 배포 모델 호출::
    • 이미지 감지를 위해 "EMO-감지-배치" 모델을 호출합니다.
    • 동영상 생성을 위해 'EMO 배포' 모델을 호출합니다.

 

관세 및 스트림 제한

패러다임모델 이름아이템 가격무료 할당량작업-다운 인터페이스 QPS 제한동시 처리 중인 작업 수
모델 호출이모-감지-V1모델 통화, 후불:

장당 0.004위안

200매

유효 기간: 백 개의 정유소 오픈 후 180일 후

5무제한 동기화 인터페이스
emo-v1모델 통화, 후불:

  • 1:1 프레임 동영상 생성: 초당 $0.08
  • 3:4 포맷 동영상 생성: 초당 $0.16
1800초.

유효 기간: 백 개의 정유소 오픈 후 180일 후

1

(동시에 하나의 작업만 실제로 실행 중이고 대기열의 다른 작업은 대기 중입니다.)

모델 배포감정 감지모델은 독립적으로 배포되며 선불로 제공됩니다:

  • 10,000/계산 단위/월
  • 20/계산 단위/시간

배포에 성공한 후 호출해야 하며 배포 수수료만 청구됩니다.

가지고 있지 않다5하나의 산술 단위가 5개의 동시성을 지원합니다.
emo1 산술 단위는 1 동시성 지원

 

주의

  • 관세 및 스트림 제한사용량에 따라 요금이 부과되며, 구체적인 요금은 AliCloud의 공식 문서를 참조하세요.
  • 동시성 제한구매하신 산술 단위에 따라 지원되는 동시 작업 수가 다릅니다.
© 저작권 정책
AiPPT

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...