はじめに
Reka社は、新世代のマルチモーダルAIソリューションの提供を専門とする企業である。同社の製品には、テキスト、コード、画像、動画、音声データの処理をサポートするReka Core、Flash、Edge、Sparkモデルがあります。Rekaのモデルは、デバイスサイド、ローカル、クラウドなど、幅広い導入環境に対応する強力な推論機能と多言語サポートを特徴としています。
機能一覧
- マルチモーダルデータ処理テキスト、コード、画像、ビデオ、オーディオデータの処理に対応。
- 多言語サポート32言語の処理と理解に対応。
- 複合推論論理的、物理的、時間的に推論する能力。
- 視覚的理解OCR、PDF、表、グラフ、ダイアグラムをサポートしています。
- 音声理解別途音声認識を行うことなく、多言語音声を理解することができます。
- 命令のフォローとチェイニング複雑なマルチステップ命令を実行でき、エージェントのタスクをサポートするベースモジュールとして最適。
- コーディングとツールの使用従来のチャットボットの枠を超え、関数呼び出しやコード実行によるツール利用をサポート。
- 音声出力音声にデコード可能なオーディオ・トークンの生成をサポート。
ヘルプの使用
インストールと使用
レカAIのモデルは複雑なインストールプロセスを必要とせず、ユーザーはレカの公式ウェブサイトから直接アクセスして使用することができます。以下は、レカの詳しい使用手順です:
- アカウントの作成ページ右上の「登録」ボタンをクリックし、必要事項を入力してアカウントを作成してください。すでにアカウントをお持ちの方は、「ログイン」をクリックしてください。
- モデルを選択: ログイン後、モデル選択ページに進み、ニーズに応じて適切なモデル(例:Reka Core、Flash、Edge、Spark)を選択します。
- データのアップロード処理するデータの種類(テキスト、コード、画像、動画、音声)を選択し、該当するファイルをアップロードします。
- 操作するページ上のプロンプトに従って、実行するタスク(テキスト翻訳、画像認識、音声処理など)を選択し、"Start "ボタンをクリックします。
- 結果を見るタスクが完了すると、システムが処理結果を生成し、ユーザーが直接ダウンロードまたは閲覧できる。
主な機能
マルチモーダルデータ処理
- テキスト処理テキストファイルをアップロードし、実行するタスク(翻訳、要約生成など)を選択し、「開始」ボタンをクリックすると、システムが自動的に処理し、結果を生成します。
- コードハンドリングコードファイルをアップロードし、実行するタスク(コードレビュー、エラー検出など)を選択し、「開始」ボタンをクリックすると、システムが自動的に処理し、結果を生成します。
- 画像処理画像ファイルをアップロードし、実行するタスク(画像認識、OCRなど)を選択し、「開始」ボタンをクリックすると、システムが自動的に処理し、結果を生成します。
- ビデオ加工ビデオファイルをアップロードし、実行するタスク(ビデオ解析、シーン認識など)を選択し、「開始」ボタンをクリックすると、システムが自動的に処理し、結果を生成します。
- 音響処理音声ファイルをアップロードし、実行するタスク(音声認識、感情分析など)を選択し、「開始」ボタンをクリックすると、システムが自動的に処理し、結果を生成します。
複合推論
レカのモデルは強力な推論機能を備えており、ユーザーが関連データをアップロードし、実行する推論タスク(論理的推論、物理的推論、時間的推論など)を選択すると、システムが自動的に処理して結果を生成する。
視覚的理解
レカのモデルは、任意の解像度とアスペクト比の画像や動画を理解することができる。 ユーザーは関連文書をアップロードし、実行するタスク(OCR、PDF理解、表認識など)を選択すると、システムが自動的に処理し、結果を生成する。
音声理解
レカのモデルは、音声認識を別途行うことなく、多言語音声を理解する。 ユーザーは音声ファイルをアップロードし、必要なタスク(音声認識、感情分析など)を選択すると、システムが自動的に処理し、結果を生成する。
命令のフォローとチェイニング
レカのモデルは、複雑なマルチステップ・コマンドを実行することができる。 ユーザーが関連データをアップロードし、実行するタスク(マルチステップ・コマンドの実行、連鎖操作など)を選択すると、システムが自動的に処理し、結果を生成する。
コーディングとツールの使用
レカのモデルは、関数呼び出しとコード実行によるツールの使用をサポートしています。 ユーザーはコードファイルをアップロードし、実行するタスク(関数呼び出し、コード実行など)を選択すると、システムが自動的に処理し、結果を生成します。
音声出力
レカのモデルは、音声にデコードできる音声トークンの生成をサポートしている。 ユーザーはテキストファイルをアップロードし、音声を生成する必要があるタスクを選択すると、システムが自動的に処理し、結果を生成する。