Utilisez Whisper pour transcrire votre voix dans de multiples formats gratuitement !

Tutoriels pratiques sur l'IAMise à jour il y a 8 mois Cercle de partage de l'IA

10.8K 00

Vous devez souvent transcrire en texte des enregistrements de réunions ou d'entretiens ? Étant donné que la rédaction de transcriptions mot à mot prend beaucoup de temps et nécessite une main-d'œuvre importante, vous souhaiterez peut-être utiliser des outils d'IA pour convertir les enregistrements audio en texte. Dans cet article, nous vous présentons Whisper, un système de reconnaissance automatique de la parole (ASR) de l'équipe OpenAI. Selon la description d'OpenAI sur Github, Whisper est un modèle de reconnaissance vocale open source qui reconnaît actuellement environ 96 langues dans le monde et les convertit en texte. En termes de précision de reconnaissance du chinois, Whisper a atteint un niveau assez élevé. Grâce à Chuchotement Il s'agit d'une technologie open source, il vous suffit donc de disposer d'un compte Google et d'un code de commande pour l'installer. Une fois téléchargé et installé sur votre ordinateur, vous pouvez utiliser Whisper pour effectuer des tâches de reconnaissance vocale et de transcription gratuitement et sans restrictions de la part des développeurs.

Code d'installation Whisper :!pip install git+https://github.com/openai/whisper.git
Code d'installation de Ffmpeg :!sudo apt update && sudo apt install ffmpeg
Code d'exécution de la parole en texte :!whisper "文件名（需要替换）.mp3" --model medium

Étape 1 : Connectez-vous à votre compte Google, ouvrez Google Drive, cliquez sur "+Nouveau" dans le coin supérieur gauche, faites défiler l'écran jusqu'à ce que vous trouviez "Plus", puis cliquez sur "Connecter d'autres applications".

Étape 2 : La première fois que vous faites cela, la place de marché de l'application Google Workspace s'ouvre, entrez "Google Colaboratory" dans la barre de recherche et sélectionnez-le.

Étape 3 : Cliquez sur "Installer" pour procéder à l'installation et sélectionnez "Continuer" pour poursuivre. Il vous sera demandé de vous connecter avec votre compte Google et de suivre les instructions pour terminer l'installation.

Étape 4 : Retournez à la page d'accueil de Google Drive, cliquez à nouveau sur "+Nouveau" dans le coin supérieur gauche et sélectionnez l'application "Google Colaboratory" dans les options supplémentaires.

Étape 5 : Une fois le fichier ouvert, vous pouvez en modifier le nom pour pouvoir le réutiliser plus tard.

Étape 6 : Cliquez sur "Phase d'exécution" dans la colonne supérieure et sélectionnez "Modifier le type de phase d'exécution".

Étape 7 : À ce stade, vous pouvez sélectionner différents types d'exécution et de ressources de calcul. Sélectionnez "Python 3" et "T4 GPU" et cliquez sur "Enregistrer".

Étape 8 : Trouvez le mot "Connect" dans le coin supérieur droit de la fenêtre, cliquez dessus et attendez que la connexion soit établie.

Étape 9 : Une fois la connexion terminée, vous pouvez voir les paramètres de l'ordinateur, y compris les informations relatives au GPU, à la mémoire et au disque dur.

Étape 10 : Ensuite, pour installer Whisper, entrez le code d'installation de Whisper et le code d'installation de ffmpeg dans la première et la deuxième ligne de la barre centrale respectivement et cliquez sur Exécuter.

Étape 11 : Une fois l'installation terminée, cliquez sur l'icône de dossier sur le côté gauche, sélectionnez "Upload Files", et téléchargez les fichiers MP3 que vous devez transcrire.

Étape 12 : Cliquez sur "+Code" et saisissez le code d'exécution de la synthèse vocale. Assurez-vous que le nom et le suffixe du fichier sont identiques à ceux du fichier téléchargé, puis cliquez sur "Exécuter".

Tutoriels pratiques sur l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Utiliser l'API Ollama en Java

Tutoriels pratiques sur l'IA

Il y a 6 mois

010.2K

Langchain-Chatchat 部署教程！免费开源可商用，完全本地化推理的知识库增强方案

Tutoriel de déploiement de Langchain-Chatchat ! Solution d'enrichissement de la base de connaissances de raisonnement entièrement localisée, gratuite et à code source ouvert, disponible dans le commerce

Tutoriels pratiques sur l'IA

il y a 1 an

011.4K

Utiliser l'API Ollama en C++

Tutoriels pratiques sur l'IA

Il y a 6 mois

09.9K

Comment contrôler la taille de la carte et utiliser d'autres options de mise en page dans Gamma

Tutoriels pratiques sur l'IA

il y a 1 an

015.1K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Utilisez Whisper pour transcrire votre voix dans de multiples formats gratuitement !

Étape 1 : Connectez-vous à votre compte Google, ouvrez Google Drive, cliquez sur "+Nouveau" dans le coin supérieur gauche, faites défiler l'écran jusqu'à ce que vous trouviez "Plus", puis cliquez sur "Connecter d'autres applications".

Étape 2 : La première fois que vous faites cela, la place de marché de l'application Google Workspace s'ouvre, entrez "Google Colaboratory" dans la barre de recherche et sélectionnez-le.

Étape 3 : Cliquez sur "Installer" pour procéder à l'installation et sélectionnez "Continuer" pour poursuivre. Il vous sera demandé de vous connecter avec votre compte Google et de suivre les instructions pour terminer l'installation.

Étape 4 : Retournez à la page d'accueil de Google Drive, cliquez à nouveau sur "+Nouveau" dans le coin supérieur gauche et sélectionnez l'application "Google Colaboratory" dans les options supplémentaires.

Étape 5 : Une fois le fichier ouvert, vous pouvez en modifier le nom pour pouvoir le réutiliser plus tard.

Étape 6 : Cliquez sur "Phase d'exécution" dans la colonne supérieure et sélectionnez "Modifier le type de phase d'exécution".

Étape 7 : À ce stade, vous pouvez sélectionner différents types d'exécution et de ressources de calcul. Sélectionnez "Python 3" et "T4 GPU" et cliquez sur "Enregistrer".

Étape 8 : Trouvez le mot "Connect" dans le coin supérieur droit de la fenêtre, cliquez dessus et attendez que la connexion soit établie.

Étape 9 : Une fois la connexion terminée, vous pouvez voir les paramètres de l'ordinateur, y compris les informations relatives au GPU, à la mémoire et au disque dur.

Étape 10 : Ensuite, pour installer Whisper, entrez le code d'installation de Whisper et le code d'installation de ffmpeg dans la première et la deuxième ligne de la barre centrale respectivement et cliquez sur Exécuter.

Étape 11 : Une fois l'installation terminée, cliquez sur l'icône de dossier sur le côté gauche, sélectionnez "Upload Files", et téléchargez les fichiers MP3 que vous devez transcrire.