OpenAI Edge TTS : API de synthèse vocale libre utilisant Edge TTS, compatible avec les formats OpenAI.

Dernières ressources sur l'IAMise à jour il y a 8 mois Cercle de partage de l'IA

22.6K 00

Introduction générale

OpenAI Edge TTS est un projet open source qui fournit une API native de synthèse vocale (TTS) compatible avec OpenAI qui utilise le service de synthèse vocale en ligne de Microsoft Edge pour permettre aux utilisateurs de générer une sortie vocale de haute qualité. OpenAI Edge TTS prend en charge un large éventail d'options vocales et de vitesses de lecture, et peut générer plusieurs formats audio. Le service peut être déployé via Docker ou Python pour un accès rapide et facile.

Articles connexes :edge-tts : module Python de synthèse vocale | Service de synthèse vocale libre ,Edge TTS Worker : Déploiement des API de synthèse vocale de Microsoft à l'aide de Cloudflare, d'un format compatible avec OpenAI et d'une interface Web packagée

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

Liste des fonctions

Points de terminaison compatibles avec OpenAILes points de terminaison TTS d'OpenAI : Ils prennent en charge la même structure de demande et le même comportement que les points de terminaison TTS d'OpenAI.
Prise en charge de plusieurs voixLa parole au service de l'environnement : Mapping OpenAI speech to Edge TTS equivalent speech.
Formats audio flexiblesPrise en charge des formats MP3, Opus, AAC, FLAC, WAV, PCM et de nombreux autres formats audio.
Vitesse de lecture réglableVitesse de lecture : La vitesse de lecture peut être réglée de 0,25x à 4,0x.
Sélection directe de la voix Edge TTSVous pouvez utiliser le mappage vocal OpenAI ou spécifier directement n'importe quelle voix Edge TTS.

Utiliser l'aide

Processus d'installation

Déploiement avec Docker (recommandé)

entrepôt de clones: :

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Création d'un fichier de variables d'environnementCréer dans le répertoire racine du projet .env contenant les variables suivantes :

   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True

Exécution de Docker Compose: :

   docker compose up --build

Pour fonctionner en arrière-plan, utilisez l'option -d Paramètres :

   docker compose up -d

Déploiement avec Python

entrepôt de clones: :

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Mise en place d'un environnement virtuel: :

   python3 -m venv venv
source venv/bin/activate

Installation des dépendances: :

   pip install -r requirements.txt

Création d'un fichier de variables d'environnementCréer dans le répertoire racine du projet .env contenant les variables ci-dessus.
Serveur d'opérations: :

   python app/main.py

Mode d'emploi

Accès à l'APILorsque le déploiement est terminé, le serveur s'exécute. http://localhost:5050Il est possible d'accéder au point de terminaison de l'API en envoyant une requête HTTP. Il est possible d'accéder au point de terminaison de l'API en envoyant une requête HTTP à /v1/audio/speech.
Générer un discours: envoie une requête POST à /v1/audio/speechLe corps de la demande contient les données JSON suivantes :

   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}

Réglage de la vitesse de lectureModification de la loi sur la protection des données speed allant de 0,25 à 4,0.
Sélectionner la voix: Utilisation voice Le paramètre spécifie la voix, les voix prises en charge sont les suivantes alloy, echo, fable, onyx, nova, shimmer etc.
format audio: Utilisation format Le paramètre spécifie le format audio, qui prend en charge mp3, opus, aac, flac, wav, pcm etc.

Grâce à ces étapes, les utilisateurs peuvent facilement déployer et utiliser le service OpenAI Edge TTS pour générer une synthèse vocale de haute qualité.

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Postes connexes

Humaniser l'IA : écrire gratuitement du contenu généré par l'IA comme du contenu écrit par un humain, en contournant les détecteurs d'IA

Dernières ressources sur l'IA # AI Rédaction

Il y a 3 mois

018.6K

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Dernières ressources sur l'IA # AI Java Open Source Projecct

Il y a 8 mois

017.9K

Internet.io : une plateforme de travail intelligente pour agréger les réponses de plusieurs modèles d'IA

Dernières ressources sur l'IA # Plate-forme de dialogue multi-modèle intégrée à l'IA # Flux de travail à code bas # Application de l'organisme intelligent

Il y a 5 mois

017.3K

CFG-Zero-star : un outil open source pour améliorer la qualité de la génération d'images et de vidéos

Dernières ressources sur l'IA # AI Aides à la génération d'images # AI Java Open Source Projecct # AI Video Generation Tool

Il y a 6 mois

020.1K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

OpenAI Edge TTS : API de synthèse vocale libre utilisant Edge TTS, compatible avec les formats OpenAI.

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Déploiement avec Docker (recommandé)

Déploiement avec Python

Mode d'emploi

Charts Not Chapters : Documentation pour générer rapidement des graphiques de visualisation de données (infographies)

UGCGenerator : les publicités vidéo à contenu personnalisé générées par l'IA deviennent facilement virales

Postes connexes

Humaniser l'IA : écrire gratuitement du contenu généré par l'IA comme du contenu écrit par un humain, en contournant les détecteurs d'IA

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Internet.io : une plateforme de travail intelligente pour agréger les réponses de plusieurs modèles d'IA

CFG-Zero-star : un outil open source pour améliorer la qualité de la génération d'images et de vidéos

Pas de commentaires

Dernières collections

Derniers articles

OpenAI Edge TTS : API de synthèse vocale libre utilisant Edge TTS, compatible avec les formats OpenAI.

Introduction générale

Liste des fonctions

Utiliser l'aide

Processus d'installation

Déploiement avec Docker (recommandé)

Déploiement avec Python

Mode d'emploi

Charts Not Chapters : Documentation pour générer rapidement des graphiques de visualisation de données (infographies)

UGCGenerator : les publicités vidéo à contenu personnalisé générées par l'IA deviennent facilement virales

Postes connexes

Humaniser l'IA : écrire gratuitement du contenu généré par l'IA comme du contenu écrit par un humain, en contournant les détecteurs d'IA

Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel

Internet.io : une plateforme de travail intelligente pour agréger les réponses de plusieurs modèles d'IA

CFG-Zero-star : un outil open source pour améliorer la qualité de la génération d'images et de vidéos

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles