Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

EMO: gerar vídeo de retrato de alta qualidade com base em imagens de retrato e áudio de voz humana.

Introdução geral

O Yummy Portrait EMO é uma ferramenta de geração de vídeo dinâmico de retrato de alta qualidade fornecida pelo Hundred Refine (Model Studio), uma grande plataforma de serviços de modelo do AliCloud. A ferramenta é baseada em imagens de retratos e arquivos de áudio de voz humana para gerar vídeos dinâmicos de retratos realistas. O Joyful Portrait EMO contém dois modelos independentes: "Joyful Portrait EMO-detect" e "Joyful Portrait EMO", que são usados para detecção de conformidade de imagem de personagem e geração de vídeo de personagem, respectivamente. Os usuários podem gerar rapidamente vídeos de retratos de personagens de alta qualidade que estejam em conformidade com as especificações por meio de chamadas de API simples, que são adequadas para vários cenários de aplicação, como âncoras virtuais, pessoas digitais e assim por diante.

Experimente-o gratuitamente no aplicativo Tongyi. A comercialização formal está disponível por meio de chamadas de API ou implantação própria na plataforma Ali Bailian.

悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频-1

 

Lista de funções

  • Detecção de conformidade da imagem do caractereDetecção de EMO: use o modelo "EMO-detect" para detectar se a imagem de entrada está em conformidade com a especificação.
  • Geração de vídeos de personagensVídeo dinâmico: Usando o modelo "EMO Portrait", um vídeo dinâmico é gerado com base em uma imagem de retrato e um arquivo de áudio vocal.
  • Vários estilos para escolherSuporte a uma ampla gama de intensidades de estilo de movimento, como animado, moderado e calmo.
  • Chamada de APIAPI: fornece uma interface de API fácil de usar para que os desenvolvedores façam a integração.
  • implantação autônomaSuporte à implementação independente de modelo para requisitos de alta simultaneidade.

 

Usando a Ajuda

Instalação e configuração

  1. Serviço aberto: Em primeiro lugar, você precisa abrir o serviço EMO Joyful Portrait na plataforma AliCloud e obter a API Key.
  2. Obter chave de APIFaça login na sua conta do AliCloud e entre na plataforma de serviço de modelo grande, Hundred Refine, para obter a chave de API.

Etapas de uso

  1. Chamada do modelo de detecção de imagem::
    • O modelo "EMO-detect" é usado para detectar se a imagem de retrato de entrada está em conformidade com a especificação.
    • Exemplo de chamada de API:
     import requests
    url = "https://api.aliyun.com/emo-detect"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}
    data = {"image": "base64_encoded_image"}
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    
  2. Chamada do modelo de geração de vídeo::
    • Usando o modelo "Yummy Portrait EMO", insira as imagens de retrato detectadas e os arquivos de áudio vocal para gerar vídeos em movimento.
    • Exemplo de chamada de API:
     import requests
    url = "https://api.aliyun.com/emo"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}
    data = {
    "image": "base64_encoded_image",
    "audio": "base64_encoded_audio",
    "style_level": "active"
    }
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    

implantação autônoma

  1. Compra de recursosCompra de recursos de instância exclusivos na plataforma AliCloud.
  2. modelo de implantaçãoImplementar os modelos "EMO-detect-deployment" e "EMO-deployment", respectivamente.
  3. Invocar o modelo de implantação::
    • Chame o modelo "EMO-detect-deployment" para a detecção de imagens.
    • Chame o modelo de "implantação de EMO" para geração de vídeo.

 

Tarifas e restrições de fluxo

paradigma Nome do modelo preço do item cota livre Limite de QPS da interface de redução de tarefas Número de tarefas em processamento simultâneo
chamada de modelo emo-detect-v1 Chamada de modelo, pós-pago:


0,004 yuan por folha

200 folhas

Período de validade: 180 dias após a abertura das Cem Refinarias

5 Interfaces de sincronização ilimitadas
emo-v1 Chamada de modelo, pós-pago:

  • Gerar vídeo de quadro 1:1: US$ 0,08/segundo
  • Gerar vídeo no formato 3:4: US$ 0,16/segundo
1800 segundos.

Período de validade: 180 dias após a abertura das Cem Refinarias

1

(No mesmo momento, apenas um trabalho está realmente em execução e os outros trabalhos na fila estão na fila)

Implementação do modelo Detecção de emoções Os modelos são implantados de forma independente e pré-pagos:

  • US$ 10.000/unidade de cálculo/mês
  • US$ 20/unidade de cálculo/hora

Necessário para ser invocado após a implantação bem-sucedida, somente as taxas de implantação serão cobradas.

não ter 5 1 unidade aritmética suporta 5 simultaneidades
emo 1 unidade aritmética suporta 1 simultaneidade

 

advertência

  • Tarifas e restrições de fluxo: O pagamento é baseado no uso. Consulte a documentação oficial do AliCloud para obter tarifas específicas.
  • limite de simultaneidadeDependendo da unidade aritmética adquirida, há suporte para diferentes números de tarefas simultâneas.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " EMO: gerar vídeo de retrato de alta qualidade com base em imagens de retrato e áudio de voz humana.
pt_BRPortuguês do Brasil