EMO: Generación de vídeo de retrato de alta calidad basado en imágenes de retrato y audio de voz humana.

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

52.5K 00

Introducción general

Yummy Portrait EMO es una herramienta de generación de vídeo dinámico de retratos de alta calidad proporcionada por Hundred Refine (Model Studio), una gran plataforma de servicios de modelos de AliCloud. La herramienta se basa en imágenes de retratos y archivos de audio de voz humana para generar vídeos dinámicos de retratos realistas. Joyful Portrait EMO contiene dos modelos independientes: "Joyful Portrait EMO-detect" y "Joyful Portrait EMO", que se utilizan para la detección de conformidad de imágenes de personajes y la generación de vídeo de personajes, respectivamente. Los usuarios pueden generar rápidamente vídeos de retratos de personajes de alta calidad que cumplan las especificaciones mediante sencillas llamadas a la API, lo que resulta adecuado para diversos escenarios de aplicación, como presentadores virtuales, personas digitales, etc.

Experiméntelo gratis en la aplicación Tongyi. La comercialización formal está disponible a través de llamadas API o autodespliegue en la plataforma Ali Bailian.

Lista de funciones

Detección de conformidad de la imagen de caracteres: Utiliza el modelo "EMO-detect" para detectar si la imagen de entrada se ajusta a la especificación.
Generación de vídeos de personajesEl modelo "EMO Portrait" permite generar un vídeo dinámico a partir de una imagen de retrato y un archivo de audio vocal.
Varios estilos para elegir: Admite una amplia gama de intensidades de estilo de movimiento, como animado, moderado y tranquilo.
Llamada API: Proporciona una interfaz API fácil de usar para que los desarrolladores la integren.
despliegue autónomo: Admite la implantación independiente del modelo para requisitos de alta concurrencia.

Utilizar la ayuda

Instalación y configuración

Servicio abiertoEn primer lugar, debes abrir el servicio Joyful Portrait EMO en la plataforma AliCloud y obtener la clave API.
Obtener clave API: Inicia sesión en tu cuenta de AliCloud y entra en la plataforma de servicios de grandes modelos, Hundred Refine, para obtener la clave API.

Pasos de uso

Llamada al modelo de detección de imágenes::

El modelo "EMO-detect" se utiliza para detectar si la imagen de retrato de entrada se ajusta a la especificación.
Ejemplo de llamada a la API:

 import requests
url = "https://api.aliyun.com/emo-detect"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
data = {"image": "base64_encoded_image"}
response = requests.post(url, headers=headers, json=data)
print(response.json())

Llamada al modelo de generación de vídeo::

Utilizando el modelo "Yummy Portrait EMO", introduce las imágenes de retratos detectadas y los archivos de audio vocal para generar vídeo en movimiento.
Ejemplo de llamada a la API:

 import requests
url = "https://api.aliyun.com/emo"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
data = {
"image": "base64_encoded_image",
"audio": "base64_encoded_audio",
"style_level": "active"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())

despliegue autónomo

Adquisición de recursosCompra recursos de instancia exclusivos en la plataforma AliCloud.
modelo de despliegue: Despliega los modelos "EMO-detect-deployment" y "EMO-deployment" respectivamente.
Invocar el modelo de despliegue::
- Llama al modelo "EMO-detectar-desplegar" para la detección de imágenes.
- Llama al modelo "EMO-despliegue" para la generación de vídeo.

Tarifas y restricciones de flujos

paradigma	Nombre del modelo	precio del artículo	cuota libre	Límite QPS de la interfaz de tarea descendente	Número de tareas en procesamiento simultáneo
modelo de convocatoria	emo-detect-v1	Modelo de llamada, postpago: 0,004 yuanes por hoja	200 hojas Periodo de validez: 180 días después de la apertura de las Cien Refinerías	5	Interfaces de sincronización ilimitadas
modelo de convocatoria	emo-v1	Modelo de llamada, postpago: Generar vídeo de fotogramas 1:1: 0,08 $/segundo Generar vídeo en formato 3:4: 0,16 $/segundo	1800 segundos. Periodo de validez: 180 días después de la apertura de las Cien Refinerías	5	1 (En ese momento, sólo 1 trabajo se está ejecutando realmente y los demás trabajos de la cola están en espera)
Despliegue de modelos	emo-detect	Los modelos se despliegan de forma independiente y se pagan por adelantado: 10.000 $/unidad de cálculo/mes 20 $/unidad de cálculo/hora Debe invocarse una vez realizada la implantación, sólo se cobrarán las tasas de implantación.	no tener	5	1 unidad aritmética admite 5 concurrencias
Despliegue de modelos	emo		no tener	5	1 unidad aritmética admite 1 concurrencia

advertencia

Tarifas y restricciones de flujos: El pago se basa en el uso, consulte la documentación oficial de AliCloud para conocer las tarifas específicas.
límite de concurrencia: Dependiendo de la unidad aritmética adquirida, se admiten diferentes números de tareas concurrentes.

Últimos recursos sobre IA # AI Digital Man

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Reset: tratamientos de autoayuda para mejorar la ansiedad TCC diario, autoasesoramiento en salud mental

Últimos recursos sobre IA # AI Herramientas educativas

hace 1 año

054.9K

PapersGPT: El complemento Zotero AI que mejora la lectura de documentos y la eficiencia de la investigación

Últimos recursos sobre IA # AI Herramientas educativas

hace 1 año

082.6K

PocketPal AI：iOS和Android设备离线使用的小型语言模型聊天工具

PocketPal AI: una pequeña herramienta de chat de modelado lingüístico para uso sin conexión en dispositivos iOS y Android.

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 1 año

0181.9K

HIRING.STUDIO - AI Job Interview Aid Tool para generar preguntas de entrevista para puestos específicos

Últimos recursos sobre IA

hace 9 meses

041.3K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

EMO: Generación de vídeo de retrato de alta calidad basado en imágenes de retrato y audio de voz humana.

Introducción general

Lista de funciones