CosyVoice: Open-Source-Projekt zum Klonen von 3-Sekunden-Stimmen von Ali mit Unterstützung für gefühlsgesteuerte Tags
Umfassende Einführung CosyVoice ist ein mehrsprachiges, groß angelegtes Spracherzeugungsmodell, das umfassende Funktionen von der Inferenz über das Training bis zur Bereitstellung bietet. Es wurde vom FunAudioLLM-Team entwickelt und zielt darauf ab, eine hohe Sprachqualität durch fortschrittliche autoregressive Transformatoren und ODE-basierte Diffusionsmodelle zu erreichen...