DreamTalk: ¡Genera expresivos vídeos parlantes con una sola imagen de avatar!

Últimos recursos sobre IAActualizado hace 1 año Círculo de intercambio de inteligencia artificial

70.3K 00

DreamTalk Introducción general

DreamTalk es un marco de generación de cabezas parlantes expresivas basado en modelos de difusión, desarrollado conjuntamente por la Universidad de Tsinghua, Alibaba Group y la Universidad de Ciencia y Tecnología de Huazhong. Consta de tres componentes principales: una red de reducción de ruido, un experto en estilo labial y un predictor de estilo, y es capaz de generar cabezas parlantes diversas y realistas a partir de una entrada de audio. El marco es capaz de manejar audio multilingüe y ruidoso, y proporciona un movimiento facial de alta calidad y una sincronización precisa de la boca.

DreamTalk：使用一张头像图片即可生成表情丰富的说话视频

Lista de funciones de DreamTalk

Genere vídeos de cabezas parlantes realistas a partir del audio
Compatible con varios idiomas y entrada de voz
Admite la salida de múltiples estilos y expresiones
Soporte para avatares de personajes personalizados y referencias de estilo
Demostración en línea y descarga de códigos

Ayuda DreamTalk

Visite la página de inicio del proyecto para obtener más información y vídeos de demostración
Visite la dirección del artículo para leer los detalles técnicos y los resultados experimentales
Visite la dirección de GitHub para descargar el código y el modelo preentrenado
Siga la guía de instalación para configurar el entorno y las dependencias
Ejecuta inference_for_demo_video.py para razonar y generar el vídeo
Ajuste las opciones de entrada y salida según las descripciones de los parámetros

Dirección de DreamTalk Online Experience

DreamTalk Java Propiedades de código abierto

Entorno de ejecución de DreamTalk colab

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man Sincronización de puertos #

© declaración de copyright

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Artículos relacionados

Groq：AI大模型推理加速解决方案提供商,高速免费大模型接口

Groq: proveedor de soluciones de aceleración de inferencia de grandes modelos de IA, interfaz de grandes modelos gratuita y de alta velocidad

Últimos recursos sobre IA # AI Servicios abiertos Plataforma de diálogo multimodelo integrada # AI # Libre Modelo Grande API

hace 2 años

078.2K

AIEditor：创建AI驱动的富文本编辑器，支持多种前端框架

AIEditor: Creación de un editor de texto enriquecido basado en inteligencia artificial compatible con varios marcos de trabajo frontales.

Últimos recursos sobre IA # AI Escritura # AI Java Proyecto de código abierto

hace 1 año

060.2K

Open Operator：通过AI智能体在云浏览器中执行自动化操作

Open Operator: Realización de operaciones automatizadas en navegadores en la nube con inteligencia artificial

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Inteligencia de automatización de escritorio

hace 1 año

056.6K

Kozy：用文字描述快速剪辑短视频的在线工具

Kozy: una herramienta en línea para editar rápidamente vídeos cortos con descripciones de texto

Últimos recursos sobre IA # AI editor de audio/vídeo

hace 12 meses

058.8K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

ninguno

Sin comentarios...