ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

3.2K 00

はじめに

Kokoro-FastAPIは、Kokoro-82M音声合成モデルのサポートを提供するために設計されたDockerベースのFastAPIパッケージです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、生の成長したテキストの音声出力をより効率的で首尾一貫したものにするためのキュー処理と自動スプライシングを提供します。このプロジェクトはGitHubユーザーのremskyによって開発され、GitHubで公開されている。ユーザーはAPIインターフェースを通じて音声合成のリクエストを行うことができ、音声生成を必要とする様々なアプリケーションシナリオで高品質の音声出力を得ることができる。

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

機能一覧

ココロ-82M音声合成モデルのAPIパッケージの提供
NVIDIA GPUアクセラレーションに対応し、音声生成効率を向上
同時リクエストをサポートするキュー処理機能
自動スプライシング機能により、長文の一貫した音声出力を実現
Docker化されたデプロイメントにより、インストールと設定を簡素化
開発者が使い始めるためのサンプルコードとドキュメントを提供する。

ヘルプの使用

設置プロセス

DockerとNVIDIA Dockerサポートがインストールされていることを確認してください。
Kokoro-FastAPIプロジェクトリポジトリをクローンします：
```
git clone https://github.com/remsky/Kokoro-FastAPI.git
```

プロジェクト・ディレクトリに移動し、Dockerイメージをビルドする：
```
cd Kokoro-FastAPI
docker build -t kokoro-fastapi .
```

Dockerコンテナを起動する：

docker run --gpus all -d -p 8000:8000 kokoro-fastapi

APIインターフェースの使用

APIドキュメントにアクセスする：
ブラウザを開き、http://localhost:8000/docs、APIドキュメントを閲覧し、インターフェイスをテストする。
音声合成リクエストを送信する：
POSTリクエストを使って、メッセージを/generateインターフェースは、例えばテキストデータを送信する：
```
curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好，世界！"}'
```
音声出力を得る：
リクエストに成功すると、生成された音声ファイルのURLが返され、ユーザーはファイルをダウンロードまたは再生することができます。