Kokoro-ONNX: eficaz herramienta de conversión de texto en voz con soporte multilingüe y multivoz

Introducción general

Kokoro-ONNX es una herramienta de texto a voz (TTS) de código abierto basada en el tiempo de ejecución ONNX. Desarrollado por thewh1teagle, el proyecto pretende ofrecer una solución de síntesis de voz eficaz y rápida. Kokoro-ONNX es compatible con varios idiomas, entre ellos el inglés, y está previsto que lo sea también con el francés, el japonés, el coreano y el chino. La herramienta cuenta con una amplia selección de voces, incluido un modo de susurro, y tiene un rendimiento excelente, capaz de funcionar casi en tiempo real en macOS M1. El diseño ligero de kokoro-ONNX facilita su instalación y uso, por lo que es adecuada para desarrolladores e investigadores que necesiten una solución TTS eficiente.

 

Lista de funciones

  • Soporte de texto a voz (TTS) en varios idiomas
  • Múltiples opciones de voz, incluido el modo susurro
  • Rendimiento eficiente, funcionamiento casi en tiempo real
  • Diseño ligero, paquete de instalación de unos 300 MB (unos 80 MB tras la cuantificación).
  • Compatible con macOS M1
  • Código abierto, basado en las licencias MIT y Apache 2.0

 

Utilizar la ayuda

Proceso de instalación

  1. Abra un terminal (PowerShell / Bash).
  2. Ejecute el siguiente comando para instalar Kokoro-ONNX:
   pip install -U kokoro-onnx
  1. Descargar los documentos necesarioskokoro-v0_19.onnxresponder cantandovoices.jsony colocarlos en el mismo directorio.

Utilización

  1. Ejecute el siguiente comando en un terminal para iniciar Kokoro-ONNX:
   uv init -p 3.12
uv add kokoro-onnx soundfile
  1. comandante en jefe (militar)examples/save.pyPegue el contenido dehello.pyMedio.
  2. Descargar archivokokoro-v0_19.onnxresponder cantandovoices.jsony colocarlos en el mismo directorio.
  3. Ejecute el siguiente comando para generar el habla:
   python hello.py

Función Flujo de operaciones

  1. Seleccionar idioma y voz: envoices.jsonSeleccione el idioma y la voz deseados en
  2. texto introducido: enhello.pyIntroduzca el texto que desea convertir en voz en el campo
  3. Generar discurso: Después de ejecutar el script, el archivo de voz generado se guardará en el directorio especificado.

Funciones destacadas

  • Soporte multilingüeKokoro-ONNX es actualmente compatible con el inglés y tiene previsto admitir más idiomas, como el francés, el japonés, el coreano y el chino.
  • Múltiples opciones de sonido: Los usuarios pueden seleccionar diferentes voces, incluido el modo susurro, para satisfacer las necesidades de diferentes escenarios.
  • Alto rendimiento: Se ejecuta casi en tiempo real en macOS M1 para escenarios de aplicación que requieren una respuesta rápida.
  • Diseño ligero: El reducido tamaño del paquete de instalación facilita su despliegue y uso rápido.

Con estos pasos, los usuarios pueden instalar y utilizar fácilmente Kokoro-ONNX para obtener una funcionalidad eficaz de conversión de texto a voz. Los procedimientos operativos detallados y las descripciones exhaustivas de las funciones garantizan que los usuarios puedan empezar a utilizar rápidamente la herramienta y sacarle el máximo partido.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...