Conch voz lanzamiento nacional, puede ser los mejores productos chinos de doblaje de voz

No ha habido una producción nacional para el contenido de la producción de excelentes productos de voz en off, o bien sólo puede utilizar la API o el producto está bien modelo de sonido no funciona.

Por ejemplo, en el extranjero ElevenLabs Aunque el Inglés está bien, pero el chino es realmente tirando a través, el principal problema del modelo de código abierto es que la calidad del modelo es relativamente pobre, específicamente en la mala calidad de sonido, hay un claro sentido de la corriente, multi-lenguaje escenas mixtas y multi-sonido multi-significado palabra expresión inexacta y así sucesivamente.

MiniMax se puso en marcha hace un mes. Conch AI versión internacional, función de clonación de segunda voz en línea, ¡el chino y el inglés se leen muy bien en voz alta!La función de generación de voz se puso en marcha en la página doméstica hace unos días, y me sorprendió mucho cuando la probé.Admite más de 17 idiomas, control preciso de diversas expresiones emocionales y cientos de bibliotecas de sonidos para satisfacer diferentes necesidades..

Lo más importante es que la calidad de audio es realmente alta, sin ninguno de los problemas habituales en la generación de sonido, y con una opción muy personalizable que lo hace diferente cuando se ajusta, aunque se utilice el mismo tono.

Echemos un vistazo a esta pequeña pieza que he hecho, y luego veremos los efectos de las capacidades de generación de voz de Conch, tanto en términos de funcionalidad como de eficacia.

 

Opciones detalladas de personalización de funciones

Echemos un vistazo a las características de Conch Voice, es realmente potente y detallado, Conch tiene una enorme biblioteca de sonidos que soporta más de 17 idiomas.Cada idioma admite una amplia gama de tonos, y puedes elegir libremente entre voces masculinas y femeninas, así como edades..

Puede filtrar para encontrar tonos de cualquier identidad y edad que necesite, por ejemplo, nuestro guión de vídeo necesita un hombre mayor con sentido de la justicia, al que se puede acceder rápidamente a través de este filtro.

海螺语音国内上线,可能是最好的中文语音配音产品

También es posible personalizar el tono con todo detalle una vez seleccionado.

En primer lugar, se puede personalizar la emoción del tono, incluyendo feliz, triste, enojado y otros cinco o seis tipos de emociones, por ejemplo, el siguiente audio muestro el rendimiento emocional diferente del tono de novias cálido, se puede oír claramente, muy natural.

Luego está la velocidad del habla, esto es muy bueno para entender cuanto mayor sea el valor de la más rápido habla, el volumen también es muy bueno para entender, cuanto mayor sea el valor de la más fuerte habla, el tono de voz esto traté a grandes rasgos se puede entender como el valor de cuanto mayor sea la voz de la más puntiaguda, cuanto menor sea el valor de la voz de la más suave.

Controlando estas cuatro opciones de personalizaciónSe puede afinar para que suene muy diferente, aunque elijas el mismo tono, ¡es muy divertido probarlo!.

Otro consejo es añadir '' donde necesites añadir una pausa, este tipo de marcadores pueden hacer que el modelo genere una pausa de sonido durante un tiempo especificado, si tienes este tipo de necesidad puedes probar, la propia concha también puede juzgar la pausa necesaria.

海螺语音国内上线,可能是最好的中文语音配音产品

 

Potentes efectos de generación

Además de la rica timbre además de la ontología de modelo de concha es también muy potente, hemos utilizado algunos TTS de código abierto saben que muchos modelos de los problemas más comunes es los problemas de calidad de sonido, hay una sensación de corriente, algunas distorsiones algunos se añaden deliberadamente algunos son problemas de formación.

Aquí encontré un párrafo relativamente largo que escribí hace algún tiempo para que generara un poco de dictado quePuedes escuchar la calidad del sonido, que es muy buena, y las pausas son naturales y añade énfasis cuando es necesario..

Otro problema habitual del modelado del habla es la generación de contenidos muy largos.Muchos modelos admiten longitudes de texto muy cortas, Conch admite hasta 10.000 caracteres.Básicamente, esa es la longitud de los manuscritos más largos y de las novelas de un capítulo, y es perfectamente adecuada.

¡El siguiente es un período de tiempo hace me encontré con un Wu Enda dos mil palabras del manuscrito que leyó muy bien y sin problemas, la generación de la velocidad también es muy rápido, puede generar mientras vista previa, muy ahorro de tiempo!

El último problema más complicado es la escena mixta multilingüe y la escena polifónica, algunos modelos de habla relativamente buenos también suelen tener problemas, concretamente dejamos que la IA genere un texto de prueba, un párrafo contiene cinco idiomas diferentes, la caracola lee perfectamente, esto es realmente demasiado fuerte.

¡Buenos días! Je suis très heureux de vous rencontrer. Ich liebe Musik und Kunst. Me hace muy feliz. ¡Buenos días amigos! Vamos a comer.

Se trata de una escena polifónica, y determina con precisión la pronunciación de "caminar" (háng), "primero" (xíng), "banco" (háng) y "viaje" (xíng) en sus diferentes posiciones, y maneja muy bien enunciados polifónicos muy complejos.

Hoy voy a ir un paso por delante y me detendré cuando avance una línea. Mañana tengo que ir al banco, así que si me meto en un atasco, mi horario puede verse afectado.

Eso es todo para la introducción se puede jugar un poco más con él y utilizarlo en estos lugares siguientes:

Voz de la caracola: https://hailuoai.com/audioHailuo

Servicio API nacional: https://platform.minimaxi.com/document/T2AV2

 

El año pasado, no paraba de hablar con mis amigos sobre cuándo habría en China un producto de voz potente como ElevenLabs, y ahora tenemos resultados aún mejores que ElevenLabs, y en 24 años hemos conseguido modelos que rivalizan con el mejor nivel de su clase, desde imagen a vídeo y audio, así que espero que los proveedores nacionales de IA puedan darnos más sorpresas este año.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...