OpenAI Edge TTS : API de synthèse vocale libre utilisant Edge TTS, compatible avec les formats OpenAI.

Introduction générale

OpenAI Edge TTS est un projet open source qui fournit une API native de synthèse vocale (TTS) compatible avec OpenAI qui utilise le service de synthèse vocale en ligne de Microsoft Edge pour permettre aux utilisateurs de générer une sortie vocale de haute qualité. OpenAI Edge TTS prend en charge un large éventail d'options vocales et de vitesses de lecture, et peut générer plusieurs formats audio. Le service peut être déployé via Docker ou Python pour un accès rapide et facile.

Articles connexes :edge-tts : module Python de synthèse vocale | Service de synthèse vocale libre ,Edge TTS Worker : Déploiement des API de synthèse vocale de Microsoft à l'aide de Cloudflare, d'un format compatible avec OpenAI et d'une interface Web packagée

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

 

Liste des fonctions

  • Points de terminaison compatibles avec OpenAILes points de terminaison TTS d'OpenAI : Ils prennent en charge la même structure de demande et le même comportement que les points de terminaison TTS d'OpenAI.
  • Prise en charge de plusieurs voixLa parole au service de l'environnement : Mapping OpenAI speech to Edge TTS equivalent speech.
  • Formats audio flexiblesPrise en charge des formats MP3, Opus, AAC, FLAC, WAV, PCM et de nombreux autres formats audio.
  • Vitesse de lecture réglableVitesse de lecture : La vitesse de lecture peut être réglée de 0,25x à 4,0x.
  • Sélection directe de la voix Edge TTSVous pouvez utiliser le mappage vocal OpenAI ou spécifier directement n'importe quelle voix Edge TTS.

 

Utiliser l'aide

Processus d'installation

Déploiement avec Docker (recommandé)

  1. entrepôt de clones: :
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. Création d'un fichier de variables d'environnementCréer dans le répertoire racine du projet .env contenant les variables suivantes :
   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True
  1. Exécution de Docker Compose: :
   docker compose up --build

Pour fonctionner en arrière-plan, utilisez l'option -d Paramètres :

   docker compose up -d

Déploiement avec Python

  1. entrepôt de clones: :
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. Mise en place d'un environnement virtuel: :
   python3 -m venv venv
source venv/bin/activate
  1. Installation des dépendances: :
   pip install -r requirements.txt
  1. Création d'un fichier de variables d'environnementCréer dans le répertoire racine du projet .env contenant les variables ci-dessus.
  2. Serveur d'opérations: :
   python app/main.py

Mode d'emploi

  1. Accès à l'APILorsque le déploiement est terminé, le serveur s'exécute. http://localhost:5050Il est possible d'accéder au point de terminaison de l'API en envoyant une requête HTTP. Il est possible d'accéder au point de terminaison de l'API en envoyant une requête HTTP à /v1/audio/speech.
  2. Générer un discours: envoie une requête POST à /v1/audio/speechLe corps de la demande contient les données JSON suivantes :
   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}
  1. Réglage de la vitesse de lectureModification de la loi sur la protection des données speed allant de 0,25 à 4,0.
  2. Sélectionner la voix: Utilisation voice Le paramètre spécifie la voix, les voix prises en charge sont les suivantes alloy, echo, fable, onyx, nova, shimmer etc.
  3. format audio: Utilisation format Le paramètre spécifie le format audio, qui prend en charge mp3, opus, aac, flac, wav, pcm etc.

Grâce à ces étapes, les utilisateurs peuvent facilement déployer et utiliser le service OpenAI Edge TTS pour générer une synthèse vocale de haute qualité.

© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...