CosyVoice: Ali lanza un proyecto de código abierto de clonación de voz en 3 segundos con soporte para etiquetas controladas emocionalmente.
Introducción CosyVoice es un modelo multilingüe de generación de voz a gran escala que ofrece capacidades completas, desde la inferencia y el entrenamiento hasta el despliegue. Desarrollado por el equipo FunAudioLLM, su objetivo es lograr un habla de alta calidad mediante transformadores autorregresivos avanzados y modelos de difusión basados en ODE....