Conch голос внутренний запуск, может быть, лучший китайский голос дубляжа продуктов
Не было отечественного производства для содержания производства отличной озвучки продуктов, либо вы можете использовать только API или продукт в порядке звуковой модели не работает.
Например, за границей ElevenLabs Хотя английский язык в порядке, но китайский действительно тянет за собой, главная проблема модели с открытым исходным кодом заключается в том, что качество модели относительно низкое, особенно в плохом качестве звука, есть четкое ощущение тока, многоязычные смешанные сцены и многозвучные многозначные слова выражения неточны и так далее.
MiniMax был запущен месяц назад. Conch AI международная версия, функция клонирования второго голоса онлайн, китайский и английский языки читаются вслух очень хорошо!Функция генерации голоса появилась на домашней странице несколько дней назад, и я был очень удивлен, когда опробовал ее.Поддержка более 17 языков, точное управление различными эмоциональными проявлениями и сотни звуковых библиотек для удовлетворения различных потребностей..
Самое главное, что качество звука действительно высокое, без обычных проблем с генерацией звука, а также с настраиваемой опцией, которая делает звук разным, даже если используется один и тот же тон.
Давайте взглянем на этот небольшой кусочек, который я сделал, а затем посмотрим на возможности генерации речи Conch, как с точки зрения функциональности, так и эффективности.
Подробные возможности настройки функций
Давайте посмотрим на возможности Conch Voice, он действительно мощный и детальный, Conch имеет огромную библиотеку звуков, поддерживающую более 17 языков.Каждый язык поддерживает широкий спектр тонов, и вы можете свободно выбирать мужской и женский голос, а также возраст..
Вы можете отфильтровать, чтобы найти тональность любой личности и возраста, которые вам нужны, например, для нашего видеосценария нужен пожилой мужчина с чувством справедливости, которого можно быстро найти с помощью этого фильтра.

Кроме того, после выбора тембра можно детально настроить его.
Прежде всего, вы можете настроить эмоцию тона, включая счастливую, грустную, сердитую и другие пять или шесть видов эмоций, например, в следующем аудио я показываю различные эмоциональные характеристики тона теплых подруг, вы можете ясно услышать это, очень естественно.
Затем скорость речи, это очень хорошо понять, чем выше значение, тем быстрее он говорит, громкость также очень хорошо понять, чем выше значение, тем громче он говорит, тон голоса это я пытался грубо можно понять как значение, чем больше голос более острым, тем меньше значение голоса более плавно.
Управляя этими четырьмя вариантами настройки, мыЕго можно настроить на разное звучание, даже если вы выбрали один и тот же тон, очень интересно попробовать!.
Еще один совет - добавьте '' там, где вам нужно добавить паузу, такие маркеры могут заставить модель генерировать звуковую паузу на определенное время, если у вас есть такая необходимость, вы можете попробовать, конх сам также может определить необходимую паузу.

Мощные эффекты генерации
В дополнение к богатому тембру в дополнение к диффузору модель онтологии также очень мощный, мы использовали некоторые открытые источники TTS знаю, что многие модели из наиболее распространенных проблем является качество звука проблемы, есть ощущение тока, некоторые искажения некоторые намеренно добавлены некоторые проблемы обучения.
Здесь я нашел относительно длинный абзац, который написал некоторое время назад, чтобы он немного продиктовал, чтоВы можете послушать качество звука, которое очень хорошее, паузы естественны, и он добавляет акценты, когда это необходимо..
Другой распространенной проблемой при моделировании речи является создание очень длинного контента.Многие модели поддерживают очень короткие тексты, Conch же поддерживает до 10 000 символов.В принципе, такова длина более длинных рукописей и романов с одной главой, и это вполне адекватно.
Ниже приводится период времени назад я нашел Wu Enda две тысячи слов рукописи он читал очень хорошо и без проблем, генерация скорость также очень быстро, он может генерировать во время предварительного просмотра, очень экономит время!
Последняя самая сложная проблема - это многоязычная смешанная сцена и полифоническая сцена, некоторые относительно хорошие речевые модели также часто имеют проблемы, в частности, пусть ИИ сгенерирует тестовый текст, абзац содержит пять разных языков, конча читает отлично, это действительно слишком сильно.
Доброе утро! Je suis très heureux de vous rencontrer. Ich liebe Musik und Kunst. Это делает меня очень счастливым. ¡Buenos días amigos! Пойдемте обедать.
Это полифоническая сцена, и он точно определяет произношение слов "walk" (háng), "first" (xíng), "bank" (háng) и "trip" (xíng) в разных позициях, а также отлично справляется с очень сложными полифоническими высказываниями.
Сегодня я собираюсь идти на шаг вперед и останавливаться, когда пройду одну линию. Завтра мне нужно ехать в банк, поэтому, если я застряну в пробке, мой график может пострадать.
Это все, что касается введения, вы можете поиграть с ним еще и использовать его в следующих местах:
Голос конча: https://hailuoai.com/audioХайлуо
国内API服务:https://platform.minimaxi.com/document/T2A%20V2
В прошлом году я постоянно обсуждал с друзьями, когда же в Китае появится мощный продукт для озвучивания, подобный ElevenLabs, и вот теперь мы добились даже лучших результатов, чем ElevenLabs, и за 24 года мы создали модели, которые конкурируют с лучшими в своем классе, начиная с изображения и заканчивая видео и аудио, так что я надеюсь, что отечественные производители ИИ смогут преподнести нам еще больше сюрпризов в этом году.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...