Utilisez Whisper pour transcrire votre voix dans de multiples formats gratuitement !

Vous devez souvent transcrire en texte des enregistrements de réunions ou d'entretiens ? Étant donné que la rédaction de transcriptions mot à mot prend beaucoup de temps et nécessite une main-d'œuvre importante, vous souhaiterez peut-être utiliser des outils d'IA pour convertir les enregistrements audio en texte. Dans cet article, nous vous présentons Whisper, un système de reconnaissance automatique de la parole (ASR) de l'équipe OpenAI. Selon la description d'OpenAI sur Github, Whisper est un modèle de reconnaissance vocale open source qui reconnaît actuellement environ 96 langues dans le monde et les convertit en texte. En termes de précision de reconnaissance du chinois, Whisper a atteint un niveau assez élevé. Grâce à Chuchotement Il s'agit d'une technologie open source, il vous suffit donc de disposer d'un compte Google et d'un code de commande pour l'installer. Une fois téléchargé et installé sur votre ordinateur, vous pouvez utiliser Whisper pour effectuer des tâches de reconnaissance vocale et de transcription gratuitement et sans restrictions de la part des développeurs.
Code d'installation Whisper :
!pip install git+https://github.com/openai/whisper.git
Code d'installation de Ffmpeg :
!sudo apt update && sudo apt install ffmpeg
Code d'exécution de la parole en texte :
!whisper "文件名(需要替换).mp3" --model medium
Étape 1 : Connectez-vous à votre compte Google, ouvrez Google Drive, cliquez sur "+Nouveau" dans le coin supérieur gauche, faites défiler l'écran jusqu'à ce que vous trouviez "Plus", puis cliquez sur "Connecter d'autres applications".

Étape 2 : La première fois que vous faites cela, la place de marché de l'application Google Workspace s'ouvre, entrez "Google Colaboratory" dans la barre de recherche et sélectionnez-le.
Étape 3 : Cliquez sur "Installer" pour procéder à l'installation et sélectionnez "Continuer" pour poursuivre. Il vous sera demandé de vous connecter avec votre compte Google et de suivre les instructions pour terminer l'installation.
Étape 4 : Retournez à la page d'accueil de Google Drive, cliquez à nouveau sur "+Nouveau" dans le coin supérieur gauche et sélectionnez l'application "Google Colaboratory" dans les options supplémentaires.

Étape 5 : Une fois le fichier ouvert, vous pouvez en modifier le nom pour pouvoir le réutiliser plus tard.

Étape 6 : Cliquez sur "Phase d'exécution" dans la colonne supérieure et sélectionnez "Modifier le type de phase d'exécution".

Étape 7 : À ce stade, vous pouvez sélectionner différents types d'exécution et de ressources de calcul. Sélectionnez "Python 3" et "T4 GPU" et cliquez sur "Enregistrer".

Étape 8 : Trouvez le mot "Connect" dans le coin supérieur droit de la fenêtre, cliquez dessus et attendez que la connexion soit établie.

Étape 9 : Une fois la connexion terminée, vous pouvez voir les paramètres de l'ordinateur, y compris les informations relatives au GPU, à la mémoire et au disque dur.

Étape 10 : Ensuite, pour installer Whisper, entrez le code d'installation de Whisper et le code d'installation de ffmpeg dans la première et la deuxième ligne de la barre centrale respectivement et cliquez sur Exécuter.

Étape 11 : Une fois l'installation terminée, cliquez sur l'icône de dossier sur le côté gauche, sélectionnez "Upload Files", et téléchargez les fichiers MP3 que vous devez transcrire.

Étape 12 : Cliquez sur "+Code" et saisissez le code d'exécution de la synthèse vocale. Assurez-vous que le nom et le suffixe du fichier sont identiques à ceux du fichier téléchargé, puis cliquez sur "Exécuter".

© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...