OpenAI Edge TTS : API de synthèse vocale libre utilisant Edge TTS, compatible avec les formats OpenAI.
Introduction générale
OpenAI Edge TTS est un projet open source qui fournit une API native de synthèse vocale (TTS) compatible avec OpenAI qui utilise le service de synthèse vocale en ligne de Microsoft Edge pour permettre aux utilisateurs de générer une sortie vocale de haute qualité. OpenAI Edge TTS prend en charge un large éventail d'options vocales et de vitesses de lecture, et peut générer plusieurs formats audio. Le service peut être déployé via Docker ou Python pour un accès rapide et facile.
Articles connexes :edge-tts : module Python de synthèse vocale | Service de synthèse vocale libre ,Edge TTS Worker : Déploiement des API de synthèse vocale de Microsoft à l'aide de Cloudflare, d'un format compatible avec OpenAI et d'une interface Web packagée

Liste des fonctions
- Points de terminaison compatibles avec OpenAILes points de terminaison TTS d'OpenAI : Ils prennent en charge la même structure de demande et le même comportement que les points de terminaison TTS d'OpenAI.
- Prise en charge de plusieurs voixLa parole au service de l'environnement : Mapping OpenAI speech to Edge TTS equivalent speech.
- Formats audio flexiblesPrise en charge des formats MP3, Opus, AAC, FLAC, WAV, PCM et de nombreux autres formats audio.
- Vitesse de lecture réglableVitesse de lecture : La vitesse de lecture peut être réglée de 0,25x à 4,0x.
- Sélection directe de la voix Edge TTSVous pouvez utiliser le mappage vocal OpenAI ou spécifier directement n'importe quelle voix Edge TTS.
Utiliser l'aide
Processus d'installation
Déploiement avec Docker (recommandé)
- entrepôt de clones: :
git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
- Création d'un fichier de variables d'environnementCréer dans le répertoire racine du projet
.env
contenant les variables suivantes :
API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True
- Exécution de Docker Compose: :
docker compose up --build
Pour fonctionner en arrière-plan, utilisez l'option -d
Paramètres :
docker compose up -d
Déploiement avec Python
- entrepôt de clones: :
git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
- Mise en place d'un environnement virtuel: :
python3 -m venv venv
source venv/bin/activate
- Installation des dépendances: :
pip install -r requirements.txt
- Création d'un fichier de variables d'environnementCréer dans le répertoire racine du projet
.env
contenant les variables ci-dessus. - Serveur d'opérations: :
python app/main.py
Mode d'emploi
- Accès à l'APILorsque le déploiement est terminé, le serveur s'exécute.
http://localhost:5050
Il est possible d'accéder au point de terminaison de l'API en envoyant une requête HTTP. Il est possible d'accéder au point de terminaison de l'API en envoyant une requête HTTP à/v1/audio/speech
. - Générer un discours: envoie une requête POST à
/v1/audio/speech
Le corps de la demande contient les données JSON suivantes :
{
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}
- Réglage de la vitesse de lectureModification de la loi sur la protection des données
speed
allant de 0,25 à 4,0. - Sélectionner la voix: Utilisation
voice
Le paramètre spécifie la voix, les voix prises en charge sont les suivantesalloy
,echo
,fable
,onyx
,nova
,shimmer
etc. - format audio: Utilisation
format
Le paramètre spécifie le format audio, qui prend en chargemp3
,opus
,aac
,flac
,wav
,pcm
etc.
Grâce à ces étapes, les utilisateurs peuvent facilement déployer et utiliser le service OpenAI Edge TTS pour générer une synthèse vocale de haute qualité.
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...