Kokoro-ONNX: eficaz herramienta de conversión de texto en voz con soporte multilingüe y multivoz
Últimos recursos sobre IAPublicado hace 7 meses Círculo de intercambio de inteligencia artificial 3.3K 00
Introducción general
Kokoro-ONNX es una herramienta de texto a voz (TTS) de código abierto basada en el tiempo de ejecución ONNX. Desarrollado por thewh1teagle, el proyecto pretende ofrecer una solución de síntesis de voz eficaz y rápida. Kokoro-ONNX es compatible con varios idiomas, entre ellos el inglés, y está previsto que lo sea también con el francés, el japonés, el coreano y el chino. La herramienta cuenta con una amplia selección de voces, incluido un modo de susurro, y tiene un rendimiento excelente, capaz de funcionar casi en tiempo real en macOS M1. El diseño ligero de kokoro-ONNX facilita su instalación y uso, por lo que es adecuada para desarrolladores e investigadores que necesiten una solución TTS eficiente.
Lista de funciones
- Soporte de texto a voz (TTS) en varios idiomas
- Múltiples opciones de voz, incluido el modo susurro
- Rendimiento eficiente, funcionamiento casi en tiempo real
- Diseño ligero, paquete de instalación de unos 300 MB (unos 80 MB tras la cuantificación).
- Compatible con macOS M1
- Código abierto, basado en las licencias MIT y Apache 2.0
Utilizar la ayuda
Proceso de instalación
- Abra un terminal (PowerShell / Bash).
- Ejecute el siguiente comando para instalar Kokoro-ONNX:
pip install -U kokoro-onnx
- Descargar los documentos necesarios
kokoro-v0_19.onnx
responder cantandovoices.json
y colocarlos en el mismo directorio.
Utilización
- Ejecute el siguiente comando en un terminal para iniciar Kokoro-ONNX:
uv init -p 3.12
uv add kokoro-onnx soundfile
- comandante en jefe (militar)
examples/save.py
Pegue el contenido dehello.py
Medio. - Descargar archivo
kokoro-v0_19.onnx
responder cantandovoices.json
y colocarlos en el mismo directorio. - Ejecute el siguiente comando para generar el habla:
python hello.py
Función Flujo de operaciones
- Seleccionar idioma y voz: en
voices.json
Seleccione el idioma y la voz deseados en - texto introducido: en
hello.py
Introduzca el texto que desea convertir en voz en el campo - Generar discurso: Después de ejecutar el script, el archivo de voz generado se guardará en el directorio especificado.
Funciones destacadas
- Soporte multilingüeKokoro-ONNX es actualmente compatible con el inglés y tiene previsto admitir más idiomas, como el francés, el japonés, el coreano y el chino.
- Múltiples opciones de sonido: Los usuarios pueden seleccionar diferentes voces, incluido el modo susurro, para satisfacer las necesidades de diferentes escenarios.
- Alto rendimiento: Se ejecuta casi en tiempo real en macOS M1 para escenarios de aplicación que requieren una respuesta rápida.
- Diseño ligero: El reducido tamaño del paquete de instalación facilita su despliegue y uso rápido.
Con estos pasos, los usuarios pueden instalar y utilizar fácilmente Kokoro-ONNX para obtener una funcionalidad eficaz de conversión de texto a voz. Los procedimientos operativos detallados y las descripciones exhaustivas de las funciones garantizan que los usuarios puedan empezar a utilizar rápidamente la herramienta y sacarle el máximo partido.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...