CosyVoice : projet open source de clonage de voix en 3 secondes lancé par Ali, avec prise en charge des étiquettes contrôlées par les émotions
Introduction CosyVoice est un modèle de génération de parole multilingue à grande échelle qui offre des capacités complètes, de l'inférence au déploiement en passant par l'entraînement. Développé par l'équipe FunAudioLLM, il vise à obtenir une parole de haute qualité grâce à des transformateurs autorégressifs avancés et des modèles de diffusion basés sur l'EDO...