Aprendizagem pessoal com IA
e orientação prática

EMO: gerar vídeo de retrato de alta qualidade com base em imagens de retrato e áudio de voz humana.

Introdução geral

O Yummy Portrait EMO é uma ferramenta de geração de vídeo dinâmico de retrato de alta qualidade fornecida pelo Hundred Refine (Model Studio), uma grande plataforma de serviços de modelo do AliCloud. A ferramenta é baseada em imagens de retratos e arquivos de áudio de voz humana para gerar vídeos dinâmicos de retratos realistas. O Joyful Portrait EMO contém dois modelos independentes: "Joyful Portrait EMO-detect" e "Joyful Portrait EMO", que são usados para detecção de conformidade de imagem de personagem e geração de vídeo de personagem, respectivamente. Os usuários podem gerar rapidamente vídeos de retratos de personagens de alta qualidade que estejam em conformidade com as especificações por meio de chamadas de API simples, que são adequadas para vários cenários de aplicação, como âncoras virtuais, pessoas digitais e assim por diante.

Experimente-o gratuitamente no aplicativo Tongyi. A comercialização formal está disponível por meio de chamadas de API ou implantação própria na plataforma Ali Bailian.

Yummy Portrait EMO: gera vídeo de movimento de retrato de alta qualidade com base em imagens de retrato e áudio de voz humana-1

 

Lista de funções

  • Detecção de conformidade da imagem do caractereDetecção de EMO: use o modelo "EMO-detect" para detectar se a imagem de entrada está em conformidade com a especificação.
  • Geração de vídeos de personagensVídeo dinâmico: Usando o modelo "EMO Portrait", um vídeo dinâmico é gerado com base em uma imagem de retrato e um arquivo de áudio vocal.
  • Vários estilos para escolherSuporte a uma ampla gama de intensidades de estilo de movimento, como animado, moderado e calmo.
  • Chamada de APIAPI: fornece uma interface de API fácil de usar para que os desenvolvedores façam a integração.
  • implantação autônomaSuporte à implementação independente de modelo para requisitos de alta simultaneidade.

 

Usando a Ajuda

Instalação e configuração

  1. Serviço aberto: Em primeiro lugar, você precisa abrir o serviço EMO Joyful Portrait na plataforma AliCloud e obter a API Key.
  2. Obter chave de APIFaça login na sua conta do AliCloud e entre na plataforma de serviço de modelo grande, Hundred Refine, para obter a chave de API.

Etapas de uso

  1. Chamada do modelo de detecção de imagem::
    • O modelo "EMO-detect" é usado para detectar se a imagem de retrato de entrada está em conformidade com a especificação.
    • Exemplo de chamada de API:
     solicitações de importação
    url = "https://api.aliyun.com/emo-detect"
    headers = {"Authorisation": "Bearer YOUR_API_KEY"}
    data = {"image": "base64_encoded_image"}
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    
  2. Chamada do modelo de geração de vídeo::
    • Usando o modelo "Yummy Portrait EMO", insira as imagens de retrato detectadas e os arquivos de áudio vocal para gerar vídeos em movimento.
    • Exemplo de chamada de API:
     solicitações de importação
    url = "https://api.aliyun.com/emo"
    headers = {"Authorisation": "Bearer YOUR_API_KEY"}
    data = {
    
    
    "style_level": "active"
    }
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    

implantação autônoma

  1. Compra de recursosCompra de recursos de instância exclusivos na plataforma AliCloud.
  2. modelo de implantaçãoImplementar os modelos "EMO-detect-deployment" e "EMO-deployment", respectivamente.
  3. Invocar o modelo de implantação::
    • Chame o modelo "EMO-detect-deployment" para a detecção de imagens.
    • Chame o modelo de "implantação de EMO" para geração de vídeo.

 

Tarifas e restrições de fluxo

paradigma Nome do modelo preço do item cota livre Limite de QPS da interface de redução de tarefas Número de tarefas em processamento simultâneo
chamada de modelo emo-detect-v1 Chamada de modelo, pós-pago:


0,004 yuan por folha

200 folhas

Período de validade: 180 dias após a abertura das Cem Refinarias

5 Interfaces de sincronização ilimitadas
emo-v1 Chamada de modelo, pós-pago:

  • Gerar vídeo de quadro 1:1: US$ 0,08/segundo
  • Gerar vídeo no formato 3:4: US$ 0,16/segundo
1800 segundos.

Período de validade: 180 dias após a abertura das Cem Refinarias

1

(No mesmo momento, apenas um trabalho está realmente em execução e os outros trabalhos na fila estão na fila)

Implementação do modelo Detecção de emoções Os modelos são implantados de forma independente e pré-pagos:

  • US$ 10.000/unidade de cálculo/mês
  • US$ 20/unidade de cálculo/hora

Necessário para ser invocado após a implantação bem-sucedida, somente as taxas de implantação serão cobradas.

não ter 5 1 unidade aritmética suporta 5 simultaneidades
emo 1 unidade aritmética suporta 1 simultaneidade

 

advertência

  • Tarifas e restrições de fluxo: O pagamento é baseado no uso. Consulte a documentação oficial do AliCloud para obter tarifas específicas.
  • limite de simultaneidadeDependendo da unidade aritmética adquirida, há suporte para diferentes números de tarefas simultâneas.
Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " EMO: gerar vídeo de retrato de alta qualidade com base em imagens de retrato e áudio de voz humana.

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil