はじめに
ココロ-ONNXは、ONNXランタイムをベースにしたオープンソースの音声合成(TTS)ツールです。このプロジェクトはthewh1teagleによって開発され、効率的で高速な音声合成ソリューションを提供することを目的としている。Kokoro-ONNXは英語を含む複数の言語をサポートしており、フランス語、日本語、韓国語、中国語のサポートも計画されている。kokoro-ONNXは軽量設計のためインストールや使用が容易で、効率的なTTSソリューションを必要とする開発者や研究者に適している。
機能一覧
- 多言語の音声合成(TTS)サポート
- ウィスパーモードを含む複数の音声オプション
- 高性能、ほぼリアルタイム
- 軽量設計、インストールパッケージは約300MB(数値化後は約80MB)
- macOS M1に対応
- MITおよびApache 2.0ライセンスに基づくオープンソース
ヘルプの使用
設置プロセス
- ターミナル(PowerShell / Bash)を開く。
- 以下のコマンドを実行して、Kokoro-ONNXをインストールしてください:
pip install -U kokoro-onnx
- 必要書類のダウンロード
ココロ-v0_19.onnx
歌で応えるボイス.json
で、同じディレクトリに置く。
使用方法
- ターミナルで以下のコマンドを実行し、Kokoro-ONNXを起動します:
uv init -p 3.12
uv add kokoro-onnxサウンドファイル
- そうしれいかん
example/save.py
の内容を貼り付ける。hello.py
真ん中だ。 - ダウンロードファイル
ココロ-v0_19.onnx
歌で応えるボイス.json
で、同じディレクトリに置く。 - 以下のコマンドを実行し、スピーチを生成する:
python hello.py
機能 操作の流れ
- 言語と音声を選択で
ボイス.json
から希望の言語と音声を選択します。 - 入力テキストで
hello.py
音声に変換するテキストを - スピーチの生成スクリプト実行後、生成された音声ファイルは指定したディレクトリに保存されます。
注目の機能
- 多言語サポートココロ-ONNXは現在、英語をサポートしており、フランス語、日本語、韓国語、中国語など、より多くの言語をサポートする予定です。
- 複数のサウンドオプションウィスパー(ささやき声)モードなど、さまざまなシーンに応じたサウンドを選択可能。
- 高性能macOS M1上でほぼリアルタイムに動作し、素早いレスポンスを必要とするアプリケーションシナリオに対応。
- 軽量設計インストールパッケージのサイズが小さいので、導入が簡単で、すぐに使用できます。
ココロ-ONNXは、この手順で簡単にインストールでき、効率的に音声合成機能を利用することができます。また、詳細な操作手順と豊富な機能説明により、すぐに使い始めることができます。