Whisper Input : un service gratuit et rapide de transcription de la voix au texte utilisant Groq

Dernières ressources sur l'IAPosté il y a 7 mois Cercle de partage de l'IA

22.5K 00

Introduction générale

Chuchotement Input est un outil de transcription vocale open source qui permet aux utilisateurs de commencer l'enregistrement de la parole en appuyant sur le bouton Option et de terminer l'enregistrement en levant le bouton. L'outil appelle Groq Le modèle Whisper Large V3 Turbo effectue la traduction vocale et fournit un retour d'information rapide en 1 à 2 secondes. SiliconFlow Modèle hébergé FunAudioLLM/SenseVoiceSmall qui permet une reconnaissance plus rapide et une plus grande précision. Il convient particulièrement aux utilisateurs qui ont besoin d'une saisie vocale efficace, y compris les malvoyants.

Liste des fonctions

Enregistrement vocal et traductionL'enregistrement peut être lancé en appuyant sur la touche Option, ou en levant la touche pour mettre fin à l'enregistrement, et appeler automatiquement le modèle pour la traduction.
Prise en charge multilingueTranscription de la parole en plusieurs langues : Prise en charge de la transcription de la parole en plusieurs langues.
Retour d'information rapideLa plupart des entrées vocales peuvent être renvoyées dans un délai de 1 à 2 secondes.
Utilisation gratuiteLes services d'aide à l'utilisation sont fournis gratuitement par Groq et SiliconFlow.
Aide à la ponctuationLa ponctuation est ajoutée automatiquement pour améliorer la lisibilité du texte traduit.
Aide à l'accessibilité: Un client macOS simple est en cours de développement pour les utilisateurs malvoyants.

Utiliser l'aide

Processus d'installation

conditions préalablesPour ce faire, vous devez disposer d'un environnement Python local, au minimum de la version 3.10.
projet de clonage: :

   git clone https://github.com/ErlichLiu/Whisper-Input.git

Créer un environnement virtuel: :

   python -m venv venv

Activer l'environnement virtuel: :
- macOS/Linux. bash source venv/bin/activate
- Fenêtres. bash .\venv\Scripts\activate
Installation des dépendances: :

   pip install pip-tools
pip-compile requirements.in
pip install -r requirements.txt

modèle de configuration

Groq Whisper Large V3 modèle

Ouvrir un compte Groq: :Page d'inscription à Groq
Obtenir la clé de l'API: :Clé d'API Groq
Configuration des variables d'environnement: :

   cp .env.example .env

Collez la CLÉ d'API dans le champ .env Documentation :

   SERVICE_PLATFORM=groq
GROQ_API_KEY=你的API_KEY

SiliconFlow FunAudioLLM/SenseVoicePetits modèles

S'inscrire à un compte SiliconFlow: :Page d'inscription à SiliconFlow
Obtenir la clé de l'API: :Clé API SiliconFlow
Configuration des variables d'environnement: :

   cp .env.example .env

Collez la CLÉ d'API dans le champ .env Documentation :

   SERVICE_PLATFORM=siliconflow
SILICONFLOW_API_KEY=你的API_KEY

programme de course

procédure de déclenchement: :

   python main.py

UtilisationLe programme effectue automatiquement la traduction vocale et affiche le résultat.

mise en garde

opération de fondLe programme doit tourner en permanence en arrière-plan, il est donc recommandé de l'exécuter dans un terminal ou un onglet de terminal qui n'est pas fermé très souvent.
Aide à l'accessibilitéLes utilisateurs malvoyants pourront à l'avenir bénéficier d'un client macOS.

Description en une phrase (brève)

Whisper Input est un outil de conversion vocale efficace qui prend en charge la saisie vocale multilingue et convertit rapidement et précisément la parole en texte pour les utilisateurs qui ont besoin d'une saisie vocale efficace.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

ChatMCP : client de chat AI qui met en œuvre le protocole MCP et prend en charge plusieurs modèles LLM.

Dernières ressources sur l'IA # Plate-forme de dialogue multi-modèle intégrée à l'IA

Il y a 9 mois

022.4K

Llasa 1~8B : un modèle de synthèse vocale à source ouverte pour la génération et le clonage de la parole de haute qualité

Dernières ressources sur l'IA # AI Java Open Source Projecct # Synthèse vocale AI # Clonage vocal AI

Il y a 7 mois

022K

Writing Frog : un assistant d'écriture IA gratuit lancé par Smart Spectrum pour générer rapidement du contenu original de haute qualité

Dernières ressources sur l'IA # AI Rédaction

il y a 1 an

017.7K

Udio : une plateforme innovante de génération de musique basée sur l'IA pour faciliter la création musicale professionnelle

Dernières ressources sur l'IA # AI Music

Il y a 12 mois

019.9K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Whisper Input : un service gratuit et rapide de transcription de la voix au texte utilisant Groq

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

modèle de configuration

Groq Whisper Large V3 modèle

SiliconFlow FunAudioLLM/SenseVoicePetits modèles

programme de course

mise en garde

Description en une phrase (brève)

Azure TTS Importer : intégration de services de synthèse vocale dans les logiciels de lecture

Quadratic : un formulaire d'analyse de données en ligne qui intègre le dialogue avec l'IA et l'exécution du code

Articles connexes

ChatMCP : client de chat AI qui met en œuvre le protocole MCP et prend en charge plusieurs modèles LLM.

Llasa 1~8B : un modèle de synthèse vocale à source ouverte pour la génération et le clonage de la parole de haute qualité

Writing Frog : un assistant d'écriture IA gratuit lancé par Smart Spectrum pour générer rapidement du contenu original de haute qualité

Udio : une plateforme innovante de génération de musique basée sur l'IA pour faciliter la création musicale professionnelle

Pas de commentaires

Dernières collections

Derniers articles

Whisper Input : un service gratuit et rapide de transcription de la voix au texte utilisant Groq

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

modèle de configuration

Groq Whisper Large V3 modèle

SiliconFlow FunAudioLLM/SenseVoicePetits modèles

programme de course

mise en garde

Description en une phrase (brève)

Azure TTS Importer : intégration de services de synthèse vocale dans les logiciels de lecture

Quadratic : un formulaire d'analyse de données en ligne qui intègre le dialogue avec l'IA et l'exécution du code

Articles connexes

ChatMCP : client de chat AI qui met en œuvre le protocole MCP et prend en charge plusieurs modèles LLM.

Llasa 1~8B : un modèle de synthèse vocale à source ouverte pour la génération et le clonage de la parole de haute qualité

Writing Frog : un assistant d'écriture IA gratuit lancé par Smart Spectrum pour générer rapidement du contenu original de haute qualité

Udio : une plateforme innovante de génération de musique basée sur l'IA pour faciliter la création musicale professionnelle

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles