MockingBird : clonage vocal rapide et formation de modèles, synthèse vocale basée sur xtts v2

Dernières ressources sur l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

13.4K 00

Introduction générale

MockingBird est un projet open source qui vise à réaliser un clonage vocal et une synthèse vocale rapides grâce à la technologie de l'IA. Les utilisateurs n'ont qu'à fournir des échantillons de voix de 5 secondes pour générer n'importe quel contenu vocal. MockingBird utilise le cadre PyTorch et fournit des outils faciles à utiliser ainsi que des instructions d'installation détaillées pour les développeurs et les chercheurs.

MockingBird：快速克隆声音与模型训练，基于 xtts v2 实现的文本转语音

Liste des fonctions

Clonage de la parole : générer un contenu vocal arbitraire à partir d'échantillons de voix de 5 secondes
Synthèse vocale : saisie d'un texte pour générer la parole correspondante
Prise en charge multilingue : prise en charge du mandarin et de plusieurs ensembles de données chinoises
Fonctionnement multiplateforme : compatible avec les systèmes Windows et Linux
Traitement en temps réel : permet de générer de la parole en temps réel
Code source ouvert : le code est ouvert pour faciliter le développement secondaire et la recherche.

Utiliser l'aide

Processus d'installation

Préparation de l'environnement: :
- Installez Python 3.7 ou une version ultérieure.
- Installez PyTorch (version 1.9.0 recommandée).
- Installer ffmpeg.
Télécharger le projet: :
- Ouvrez l'adresse du projet MockingBird, cliquez sur le bouton vert "Code" et sélectionnez "Download ZIP" pour télécharger le fichier du projet.
- Ou utilisez la commande git pour le télécharger :git clone https://github.com/babysor/MockingBird.git
Installation des dépendances: :
- Allez dans le répertoire du projet et exécutez pip install -r requirements.txt Installez les paquets Python nécessaires.
- Si nécessaire, vous pouvez utiliser conda pour créer un environnement virtuel et installer les dépendances :conda env create -n env_name -f env.ymlpuis activer l'environnement :conda activate env_name.
modèle de transcription phonétique

Afin de réduire la taille du fichier principal, qui ne contient pas le modèle son à son, si vous avez besoin de le télécharger séparément, cliquez sur le lien suivantModèle de téléchargement (3G)

Processus d'utilisation

Boîte à outils d'exécution: :
- être en mouvement demo_toolbox.pypour ouvrir l'écran Boîte à outils.
- Sélectionnez le fichier d'échantillon vocal dans la boîte à outils, entrez le contenu du texte et cliquez sur le bouton Générer pour générer le fichier vocal correspondant.
Modèles de formation: :
- Si vous avez besoin d'entraîner votre propre modèle, vous pouvez suivre le tutoriel d'entraînement dans le projet.
- Téléchargez et préparez l'ensemble de données d'entraînement, exécutez train.py Commencer la formation.
- Fichier d'aide en chinois pour les modèles de formation
appel à distance: :
- MockingBird fournit une fonction de serveur web, qui vous permet d'utiliser les résultats vocaux générés par invocation à distance.
- Configurer et démarrer le serveur web à appeler à l'aide de l'interface API.

problèmes courants

échec de l'installationLes conditions d'installation de PyTorch : Assurez-vous que votre version de Python répond aux conditions requises, et faites attention à la compatibilité des versions lors de l'installation de PyTorch.
qualité de la voixLa qualité des échantillons de parole et la richesse de l'ensemble de données d'entraînement affectent l'efficacité de la parole générée, et il est recommandé d'utiliser des échantillons de parole de haute qualité et des ensembles de données diversifiés pour l'entraînement.

Téléchargement pré-packagé pour Windows (3.7G/avec modélisation texte-son)

Lien de téléchargement Baidu.com

Télécharger Huggingface

Téléchargez/écrivez le paquet de mise à jour directement dans le répertoire app.exe.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

KushoAI : un assistant IA pour les tests automatisés d'API

Dernières ressources sur l'IA # Programmation AI

Il y a 7 mois

011.7K

Atypica : générer de belles recherches sur les entreprises grâce à un long raisonnement

Dernières ressources sur l'IA # Générer un rapport de recherche approfondi

il y a 5 mois

011.1K

Qwen-Flash - Un modèle linguistique performant et peu coûteux de Tongyi Chien-quan

Dernières ressources sur l'IA

il y a 3 semaines

010K

Easy Pen AI - Outil de rédaction de thèse AI, génère un cadre de thèse et un premier brouillon en un seul clic

Dernières ressources sur l'IA

Il y a 2 mois

09.4K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

MockingBird : clonage vocal rapide et formation de modèles, synthèse vocale basée sur xtts v2

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Processus d'utilisation

problèmes courants

Téléchargement pré-packagé pour Windows (3.7G/avec modélisation texte-son)

Clone Voice : outil de clonage vocal multilingue, sans échantillon, basé sur xtts_v2 pour Windows.

302.AI : plateforme de services d'IA payante, intégration rapide de robots d'IA, outils de conditionnement d'IA, interface de transfert d'API

Articles connexes

KushoAI : un assistant IA pour les tests automatisés d'API

Atypica : générer de belles recherches sur les entreprises grâce à un long raisonnement

Qwen-Flash - Un modèle linguistique performant et peu coûteux de Tongyi Chien-quan

Easy Pen AI - Outil de rédaction de thèse AI, génère un cadre de thèse et un premier brouillon en un seul clic

Pas de commentaires

Dernières collections

Derniers articles

MockingBird : clonage vocal rapide et formation de modèles, synthèse vocale basée sur xtts v2

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Processus d'utilisation

problèmes courants

Téléchargement pré-packagé pour Windows (3.7G/avec modélisation texte-son)

Clone Voice : outil de clonage vocal multilingue, sans échantillon, basé sur xtts_v2 pour Windows.

302.AI : plateforme de services d'IA payante, intégration rapide de robots d'IA, outils de conditionnement d'IA, interface de transfert d'API

Articles connexes

KushoAI : un assistant IA pour les tests automatisés d'API

Atypica : générer de belles recherches sur les entreprises grâce à un long raisonnement

Qwen-Flash - Un modèle linguistique performant et peu coûteux de Tongyi Chien-quan

Easy Pen AI - Outil de rédaction de thèse AI, génère un cadre de thèse et un premier brouillon en un seul clic

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles