Orate：よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

56.7K 00

はじめに

Orateは音声生成と文字起こしに特化したAIツールキットです。Orateは音声処理プロセスを簡素化するように設計されており、開発者は音声コンテンツを迅速かつ正確に生成し、書き起こすことができます。音声合成（TTS）であれ、音声テキスト化（STT）であれ、Orateは効率的で信頼性の高いソリューションを提供します。

機能一覧

音声合成 (TTS)複数の言語と音声モデルをサポートし、AIを使ってリアルな音声を生成します。
音声テキスト化（STT）複雑な音声コンテンツを、高い精度とスピードでテキストに書き起こします。
マルチAIプロバイダーのサポートOpenAI、ElevenLabs、AssemblyAIなど、多数の主要AIプロバイダーとの統合により、ユーザーはニーズに最適なサービスを選択することができます。
統一APIシンプルなAPIインターフェースで、簡単にAIサービスを切り替えて利用できます。
迅速な設置と使用複数のパッケージマネージャーがサポートされているため、インストールしてすぐに使い始めることができます。

ヘルプの使用

設置プロセス

npmによるインストール::

   npm install orate

糸を使った取り付け::

   yarn add orate

使用ガイドライン

音声合成 (TTS)

オラテ・ライブラリーのインポート::

   import { speak } from 'orate';
import { elevenlabs } from 'orate/elevenlabs';

スピーチの生成::

   const speech = await speak({
model: elevenlabs.tts('multilingual_v2', 'aria'),
prompt: 'Friends, Romans, countrymen, lend me your ears;'
});

上記のコードは、イレブンラボの多言語モデルを使ってテキストを音声に変換する。

音声テキスト化（STT）

オラテ・ライブラリーのインポート::

   import { transcribe } from 'orate';
import { assembly } from 'orate/assembly';
import audio from './audio.wav';

音声を書き起こす::

   const text = await transcribe({
model: assembly.stt('best'),
audio,
});

上記のコードは、AssemblyAIの最適なモデルを使って音声ファイルをテキストに書き起こしている。

詳細な機能操作の流れ

AIプロバイダーの選択OpenAI、ElevenLabs、AssemblyAIなど、ニーズに応じて適切なAIプロバイダーを選択する。
APIキーの設定選択したAIプロバイダーのAPIキーをOrateプロファイルに追加します。
APIの呼び出しオレートが提供する統一APIインターフェースを使用して、音声生成または書き起こしのために選択したAIプロバイダーのサービスを呼び出します。
結果生成された音声や書き起こされたテキストを取得し、その後の処理や保存に使用します。

Orateは、詳細なドキュメントとサンプルコードを提供し、ユーザーがすぐに使い始められ、その強力な音声処理機能を最大限に活用できるよう支援します。