ココロ-ONNX：多言語・多音声をサポートする効率的な音声合成ツール

94.8K 00

はじめに

ココロ-ONNXは、ONNXランタイムをベースにしたオープンソースの音声合成（TTS）ツールです。このプロジェクトはthewh1teagleによって開発され、効率的で高速な音声合成ソリューションを提供することを目的としている。Kokoro-ONNXは英語を含む複数の言語をサポートしており、フランス語、日本語、韓国語、中国語のサポートも計画されている。kokoro-ONNXは軽量設計のためインストールや使用が容易で、効率的なTTSソリューションを必要とする開発者や研究者に適している。

機能一覧

多言語の音声合成（TTS）サポート
ウィスパーモードを含む複数の音声オプション
高性能、ほぼリアルタイム
軽量設計、インストールパッケージは約300MB（数値化後は約80MB）
macOS M1に対応
MITおよびApache 2.0ライセンスに基づくオープンソース

ヘルプの使用

設置プロセス

ターミナル（PowerShell / Bash）を開く。
以下のコマンドを実行して、Kokoro-ONNXをインストールしてください：

   pip install -U kokoro-onnx

必要書類のダウンロードkokoro-v0_19.onnx歌で応えるvoices.jsonで、同じディレクトリに置く。

使用方法

ターミナルで以下のコマンドを実行し、Kokoro-ONNXを起動します：

   uv init -p 3.12
uv add kokoro-onnx soundfile

そうしれいかんexamples/save.pyの内容を貼り付ける。hello.py真ん中だ。
ダウンロードファイルkokoro-v0_19.onnx歌で応えるvoices.jsonで、同じディレクトリに置く。
以下のコマンドを実行し、スピーチを生成する：

   python hello.py

機能操作の流れ

言語と音声を選択でvoices.jsonから希望の言語と音声を選択します。
入力テキストでhello.py音声に変換するテキストを
スピーチの生成スクリプト実行後、生成された音声ファイルは指定したディレクトリに保存されます。

注目の機能

多言語サポートココロ-ONNXは現在、英語をサポートしており、フランス語、日本語、韓国語、中国語など、より多くの言語をサポートする予定です。
複数のサウンドオプションウィスパー（ささやき声）モードなど、さまざまなシーンに応じたサウンドを選択可能。
高性能macOS M1上でほぼリアルタイムに動作し、素早いレスポンスを必要とするアプリケーションシナリオに対応。
軽量設計インストールパッケージのサイズが小さいので、導入が簡単で、すぐに使用できます。

ココロ-ONNXは、この手順で簡単にインストールでき、効率的に音声合成機能を利用することができます。また、詳細な操作手順と豊富な機能説明により、すぐに使い始めることができます。

3MinTop：3分間のAI読書、素早く本の本質をつかみ読書習慣を身につける

1年前

048.5K

LiveKit: リアルタイムのオーディオおよびビデオアプリケーションを構築するためのオープンソースツール

最新のAIリソース # AIオープンサービス

11ヶ月前

0111.7K

LlamaCoder: プロンプトワードを使って小さなウェブアプリケーションを素早く生成・公開

1年前

060.7K

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

最新のAIリソース # AI Java オープンソースプロジェクト

9ヶ月前

045.7K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

ココロ-ONNX：多言語・多音声をサポートする効率的な音声合成ツール

はじめに

機能一覧

ヘルプの使用

設置プロセス

使用方法

機能操作の流れ

注目の機能

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

1-2-1-MNVTON：効率的な映像、映像の中の人によるバーチャル試着（開設予定）

関連記事

3MinTop：3分間のAI読書、素早く本の本質をつかみ読書習慣を身につける

LiveKit: リアルタイムのオーディオおよびビデオアプリケーションを構築するためのオープンソースツール

LlamaCoder: プロンプトワードを使って小さなウェブアプリケーションを素早く生成・公開

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

コメントなし

最新コレクション

最新記事

ココロ-ONNX：多言語・多音声をサポートする効率的な音声合成ツール

はじめに

機能一覧

ヘルプの使用

設置プロセス

使用方法

機能 操作の流れ

注目の機能

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

1-2-1-MNVTON：効率的な映像、映像の中の人によるバーチャル試着（開設予定）

関連記事

3MinTop：3分間のAI読書、素早く本の本質をつかみ読書習慣を身につける

LiveKit: リアルタイムのオーディオおよびビデオアプリケーションを構築するためのオープンソースツール

LlamaCoder: プロンプトワードを使って小さなウェブアプリケーションを素早く生成・公開

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

コメントなし

厳選されたAIツール

最新コレクション

最新記事

機能操作の流れ