Kokoro-ONNX : Outil de synthèse vocale efficace avec prise en charge de la sélection multilingue et multi-voix

Introduction générale

Kokoro-ONNX est un outil de synthèse vocale (TTS) open source basé sur le runtime ONNX. Développé par thewh1teagle, le projet vise à fournir une solution de synthèse vocale efficace et rapide. Kokoro-ONNX prend en charge plusieurs langues, dont l'anglais, et prévoit de prendre en charge le français, le japonais, le coréen et le chinois. L'outil propose une large sélection de voix, y compris un mode chuchotement, et offre d'excellentes performances, capables de fonctionner en temps quasi réel sur macOS M1. La conception légère de kokoro-ONNX le rend facile à installer et à utiliser, ce qui le rend approprié pour les développeurs et les chercheurs qui ont besoin d'une solution TTS efficace.

 

Liste des fonctions

  • Prise en charge de la synthèse vocale (TTS) dans plusieurs langues
  • Plusieurs options vocales, y compris le mode chuchotement
  • Performance efficace, fonctionnement en temps quasi réel
  • Conception légère, paquet d'installation d'environ 300 Mo (environ 80 Mo après quantification)
  • Compatible avec macOS M1
  • Open source, basé sur les licences MIT et Apache 2.0

 

Utiliser l'aide

Processus d'installation

  1. Ouvrez un terminal (PowerShell / Bash).
  2. Exécutez la commande suivante pour installer Kokoro-ONNX :
   pip install -U kokoro-onnx
  1. Télécharger les documents requiskokoro-v0_19.onnxrépondre en chantantvoices.jsonet les placer dans le même répertoire.

Utilisation

  1. Exécutez la commande suivante dans un terminal pour démarrer Kokoro-ONNX :
   uv init -p 3.12
uv add kokoro-onnx soundfile
  1. commandant en chef (militaire)examples/save.pyCollez le contenu de la fenêtrehello.pyAu milieu.
  2. Télécharger le fichierkokoro-v0_19.onnxrépondre en chantantvoices.jsonet les placer dans le même répertoire.
  3. Exécutez la commande suivante pour générer un discours :
   python hello.py

Fonction Opération Déroulement

  1. Sélection de la langue et de la voix: envoices.jsonSélectionnez la langue et la voix souhaitées dans le menu
  2. texte d'entrée: enhello.pyEntrez le texte à convertir en parole dans le champ
  3. Générer un discoursAprès l'exécution du script, le fichier vocal généré sera sauvegardé dans le répertoire spécifié.

Fonctions vedettes

  • Prise en charge multilingueKokoro-ONNX prend actuellement en charge l'anglais et prévoit de prendre en charge d'autres langues telles que le français, le japonais, le coréen et le chinois.
  • Plusieurs options sonoresLes utilisateurs peuvent sélectionner différents sons, y compris le mode chuchotement, pour répondre aux besoins de différents scénarios.
  • Haute performanceLe système de gestion de l'information : Il fonctionne en temps quasi réel sur macOS M1 pour les scénarios d'application qui requièrent une réponse rapide.
  • Conception légèreLe logiciel est facile à déployer et à utiliser grâce à la taille réduite du paquet d'installation.

En suivant ces étapes, les utilisateurs peuvent facilement installer et utiliser Kokoro-ONNX pour une fonctionnalité de synthèse vocale efficace. Des procédures d'utilisation détaillées et des descriptions détaillées des fonctionnalités permettent aux utilisateurs de démarrer rapidement et de tirer pleinement parti de l'outil.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...