Voice-Pro : outil de traduction vidéo multifonctionnel open source, transcription et traduction de la voix en plusieurs langues, installation en un seul clic sous Windows

Dernières ressources sur l'IAPosté il y a 10 mois Cercle de partage de l'IA

21.9K 00

Introduction générale

Voice-Pro est un outil multifonctionnel basé sur Gradio WebUI qui prend en charge la conversion de la parole en texte, la synthèse vocale, la traduction en temps réel, le téléchargement de vidéos YouTube et la séparation de la voix humaine. Il intègre les technologies Whisper, Faster-Whisper et Whisper-Timestamped afin de fournir un traitement audio et une traduction efficaces pour de multiples langues et scénarios.

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Liste des fonctions

de la parole au texteLa prise en charge de Whisper, Faster-Whisper et Whisper-Timestamped permet une reconnaissance vocale très précise.
synthèse vocalePrise en charge Edge-TTS et F5-TTS, avec plusieurs choix de langues et de voix, et prise en charge des ajustements de vitesse, de volume et de hauteur.
traduction en temps réelLa reconnaissance vocale et la traduction en temps réel sont possibles dans plusieurs langues.
Téléchargement YouTubeVous pouvez télécharger des vidéos YouTube et extraire des fichiers audio (mp3, wav, flac).
séparation vocaleSéparation des sons vocaux et des sons d'ambiance à l'aide des moteurs MDX-Net et Demucs.
fichier de lotLe logiciel permet de générer des sous-titres, de les traduire et de les convertir en synthèse vocale à partir de grandes quantités de fichiers.
Génération de sous-titresLe logiciel d'édition de sous-titres : Il permet de générer et d'éditer des sous-titres dans plus de 90 langues.
Support multiformatTous les formats vidéo et audio pris en charge par ffmpeg sont pris en charge.

Utiliser l'aide

Processus d'installation

pack de démarragePour cela, il faut : cloner ou télécharger la dernière version du code source sur GitHub.
```
git clone https://github.com/abus-aikorea/voice-pro.git
```

Installer et exécuter le programme: :
- être en mouvement configure.bat Installez les dépendances nécessaires (par exemple git, ffmpeg et CUDA).
- être en mouvement start.bat Démarrez Voice-Pro et l'interface WebUI s'exécutera automatiquement.
- Lors de la première exécution, Voice-Pro s'installe d'abord, ce qui peut prendre une heure ou plus, pendant laquelle il ne faut pas fermer la fenêtre de commande Windows.

Fonctions d'utilisation

de la parole au texte: :
- Dans l'onglet Studio, sélectionnez Chuchotement Modèles et types de calculs.
- Téléchargez un fichier audio ou sélectionnez une source d'entrée audio (un microphone, par exemple).
- Cliquez sur le bouton "Démarrer" et attendez que la reconnaissance vocale et la création des sous-titres soient terminées.
l'équarrissage: :
- Téléchargez les fichiers de texte ou de sous-titres à traduire dans l'onglet Traduire.
- Sélectionnez la langue cible et cliquez sur le bouton "Traduire".
- Une fois la traduction terminée, vous pouvez télécharger le fichier traduit.
synthèse vocale: :
- Sélectionnez Edge-TTS ou F5-TTS dans l'onglet TTS.
- Saisissez le texte à convertir et sélectionnez les paramètres vocaux (vitesse, volume, hauteur).
- Cliquez sur le bouton "Générer la voix" et attendez que la génération de la voix soit terminée.
Téléchargement YouTube: :
- Saisissez le lien de la vidéo YouTube dans l'onglet YouTube Downloader.
- Sélectionnez le format audio (mp3, wav, flac) et cliquez sur le bouton "Télécharger".
- Une fois le téléchargement terminé, vous trouverez le fichier audio dans le dossier spécifié.
séparation des sons: :
- Téléchargez les fichiers audio dans l'onglet Vocal Remover.
- Sélectionnez le moteur MDX-Net ou Demucs et cliquez sur le bouton Démarrer.
- Attendez que la séparation des sons soit terminée et vous pouvez télécharger le fichier audio séparé.
fichier de lot: :
- Télécharger plusieurs fichiers dans l'onglet Lot.
- Sélectionnez l'opération souhaitée (sous-titrage, traduction, synthèse vocale).
- Cliquez sur le bouton "Démarrer" et attendez la fin du traitement par lots.

problèmes courants

Le navigateur ne s'exécute pas automatiquementFermer la fenêtre de commande Windows et réexécuter la commande start.batou saisissez manuellement l'adresse affichée dans votre navigateur (par exemple http://127.0.0.1:7892).
Erreur de mémoire insuffisante CUDAVérifier l'état de la mémoire du GPU et ajuster le niveau de réduction du bruit ou le type de calcul.
Avertissement de Windows DefenderPour plus d'informations, veuillez consulter la page suivante : Ajoutez le fichier batch en tant qu'exception ou désactivez temporairement Windows Defender.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Kimi K2-0905 - Le dernier modèle de Dark Side of the Moon !

Dernières ressources sur l'IA

Il y a 2 semaines

013.4K

AI : Éditeur de photos intelligent|Suppression gratuite de l'arrière-plan|Modèle habillé|Changement de visage

Dernières ressources sur l'IA # AI keying pour changer d'arrière-plan # AI Face Swap and Dress Up (échange de visages et habillage)

Il y a 11 mois

020.8K

Tentacule AI : Outil de dessin AI facile à utiliser et permettant d'apprendre son propre style d'image.

Dernières ressources sur l'IA # AI génération d'images en ligne

il y a 1 an

021.1K

Khoj : Convertir des documents et des notes locales en une base de connaissances pour la recherche d'informations

Dernières ressources sur l'IA # AI Notes

Il y a 10 mois

017.3K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Voice-Pro : outil de traduction vidéo multifonctionnel open source, transcription et traduction de la voix en plusieurs langues, installation en un seul clic sous Windows

Introduction générale

Liste des fonctions