はじめに
アクアボイスはインテリジェントな音声ベースのテキスト生成ツールで、ユーザーの音声をフォーマットされたテキストに素早く変換することに重点を置いている。2023年にフィニアン・ブラウンとジャック・マッキンタイアによって設立され、YコンビネーターW24インキュベーション・プログラムの一環として米国サンフランシスコに本社を置くアクアボイスは、音声を正確に書き起こすだけでなく、文脈に基づいてユーザーの意図を理解し、自動的にテキストをフォーマットして電子メール、コード、メッセージなどのコンテンツを生成する。起動時間は200ミリ秒以下、テキスト出力の待ち時間は450ミリ秒と短く、エラー率はSiriやGoogleの音声入力の約17分の1と、応答性に優れている。MacとWindowsに対応しているため、プラグインを追加することなくさまざまなアプリで使用することができ、テキスト作業を効率的にこなす必要のあるユーザーに最適だ。
機能一覧
- 高精度の音声書き起こし音声をリアルタイムでテキストに変換し、スペル、文法、書式を自動的に修正します。
- 自然言語教育リストにしてください」「表を挿入してください」など、簡単な口頭指示で文章を調整する。
- コンテクストセンシティブ画面のコンテンツやドキュメントのコンテキストに基づいて、インテリジェントに情報を補足したり、出力を最適化します。
- 超低遅延起動時間は200ミリ秒以下、高速モード出力遅延は約450ミリ秒。
- ストリーミングモード複雑なタスクでも約850ミリ秒のレイテンシーで連続音声入力をサポート。
- アプリケーション間の互換性Notion、Slack、VSCodeなどのアプリにプラグインなしで直接テキストを入力できます。
- コードの理解シンタックスハイライトと用語訂正をサポートし、開発者のためにコード関連の書き起こしを最適化します。
- カスタム辞書正確な文字起こしのために、独自の語彙(名前や専門用語など)を追加する。
- プライバシーデータはローカルで処理され、プライバシーとセキュリティを保護するためにユーザーデータは保存されません。
ヘルプの使用
設置プロセス
- 公式サイト(https://withaqua.com/)にアクセスし、ページ上部の「ダウンロード」ボタンをクリックする。
- お使いのオペレーティングシステムに合わせてバージョンを選択してください:
- マックユーザーはアップルシリコンバージョンかインテルバージョンを選ぶ。
- Windowsユーザーは、一般的なインストールパッケージを直接ダウンロードする。
- ダウンロードが完了したら、インストールパッケージをダブルクリックし、プロンプトに従ってインストールを完了します。通常、全プロセスにかかる時間はわずか3~5分です。
- アクアボイスを起動すると、ソフトウェアが自動的にマイクを検出し、接続を促します。何か問題があれば、公式サイトのFAQで解決策を確認してください。
- 無料版では1,000語のトライアルが可能。トライアル終了後、プロ版(月10ドルまたは年96ドル)への加入を選択できます。
使用方法
アクアボイスの核心は、音声でテキストを素早く生成・編集する機能です。これは使いやすく、幅広いシナリオに適しています。以下は、その詳細な使用ガイドです:
基本的な音声入力
- アクアボイスを開き、マイクのアイコンをクリックするか、デフォルトのショートカットキーを押します。
Ctrl+Space
(カスタマイズ可能) 録画を開始します。 - サラに明日の会議がキャンセルになったことを説明するメールを書いてください。ソフトウェアがフォーマットされたテキストを生成します:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
- 短いポーズは自動的に分割され、マイクアイコンを長押しすると録音が終了します。
自然言語による指示
アクアボイスは、簡単なコマンドでテキストのフォーマットをサポートします。例えば
- change to list "と言えば、テキストが変わる:
- 明天原定的会议已取消
- 请知悉
- フォームを挿入」と言えば、フォームが生成される:
| 任务 | 状态 |
|----------|--------|
| 会议 | 取消 |
- この段落を短くしてください」と言うと、例えば「受領の確認をしてください」を「確認してください」に置き換えるなど、文章をスリム化してくれる。
指示は明確にし、複雑な記述は避ける。例えば、「本文の構成を最適化する」よりも、「この部分をより簡潔にする」の方がわかりやすい。
アプリケーションの横断的利用
アクアボイスはプラグインなしで複数のアプリケーションで動作します:
- Slack、Notion、Gmailで、ショートカットキーを押してAqua Voiceを起動します。
- ジョンに返信し、プロジェクトが完了したことを伝える。ソフトが直接入力してくれる:
嗨 John,项目已经完成,请确认。
- 完了したら、手動で送信するか、「送信」と言えばアプリ内送信機能が起動する(アプリのサポートが必要)。
注目の機能操作
- コンテクストセンシティブ
アクアボイスは画面上のコンテンツから文脈を理解します。例
- コードを書くときに「コメントを追加」と言えば、次のようなものが生成される。
// 初始化用户数据
注釈がある。 - メールの中で "Fill in date "と言えば、現在の日付、例えば "10 April 2025 "が挿入される。
- 人の名前(例:"Tom")が言及された場合、スペルミスを最小限に抑えるため、画面上の連絡先リストを参照します。
- コード理解とシンタックスハイライト
開発者向けには、Aqua Voiceが専門用語を認識し、出力を最適化します:
- IDパラメータを受け取る関数getUserDataを作成する:
async function getUserData(id) { const response = await fetch(`/users/${id}`); return response.json(); }
- ジェイソン」を「JSON」に変更するなど、用語を自動的に修正。
- ストリーミング・モード対高速モード
- 高速モード(インスタント・モード):約450ミリ秒の遅延を伴う短文入力に適しています。発話後すぐにテキストが出力される。
- ストリーミングモード(ストリーミングモード):長い段落や複雑な作業に。話し言葉そのままの音声で、長い文書の口述に適しています。
- Switch Mode:設定で選択するか、「Switch to Streaming Mode」と言う。
- カスタム辞書
- Grok "や "xAI "といった独自の単語を設定に追加し、正確な文字起こしを行う。
- 例:"Grok "を追加した後、"Grok is an AI assistant "と言えば、"Grock "とスペルミスされることはない。
- プライバシーとセキュリティ
- 音声データはすべてローカルで処理され、クラウドにはアップロードされない。
- 画面コンテキストの解析は、出力を最適化するためだけに使用され、情報は保存されない。
ほら
- バックグラウンドノイズが転写の正確さを妨げないよう、マイクの品質が良好であることを確認してください。
- 現在のところ英語しかサポートしておらず、中国語の音声入力は当面サポートされないが、開発チームは多言語機能を開発中だと述べている。
- ネットワークに接続することで、コンテキストの認識は向上するが、オフラインモードでも基本的な機能については問題ない。
- 定期的に公式ウェブサイト(https://withaqua.com/changelog)をチェックし、最新のアップデートを確認することで、ソフトウェアが自動的に新しいバージョンのプロンプトを表示します。
高等技術
- 複雑な文書フォーマットタイトル、本文、結論を含む構造化されたテキストが生成される。
- マルチタスクストリーミング・モードで、「アンナに予定を説明するメールを書いて、それからToDoリストを作って」と言えば、ソフトが順番にやってくれる。
- ショートカットの最適化を設定するなど、設定でショートカットを調整してください。
Ctrl+Space
に変えるAlt+V
業務効率を高める。
これらの機能により、ユーザーは簡単なメッセージから複雑なコードまで、音声を使って簡単に編集を完了することができ、手作業による入力時間を大幅に短縮することができる。
アプリケーションシナリオ
- 職場における効果的なコミュニケーション
シナリオ説明:多忙なマネージャーは、会議の合間に複数のEメールに返信する必要があります。アクアボイスを使ってEメールの内容を口述すると、ソフトウェアが自動的にフォーマットされたテキストを生成し、直接送信できるので時間を節約できます。 - 開発者のための迅速なコーディング
シナリオ説明:プログラマーが「REST APIエンドポイントを作成する」といったコードロジックを指示すると、Aqua Voiceが正確なコードスニペットを生成し、手作業によるキーボード入力の必要性を減らします。 - 生徒の授業ノート
シナリオの説明: 学生が講義を音声で録音し、「アウトラインに整理する」と言うと、授業後に簡単に整理できる復習用資料がすぐに作成される。 - アクセシビリティ・エイド
シナリオの説明:タイピングができないユーザーが、生活や仕事の効率を高めるために、メッセージの送信や文書の編集を完了するために、音声で便利にコンピュータを操作する。
品質保証
- アクアボイスは中国語音声に対応していますか?
現在は英語のみ対応、中国語機能は開発中。アップデートは公式サイトhttps://withaqua.com/blog。 - 無料版の制限は?
無料版では、1000語のトライアルと5つのカスタム辞書スロットが利用できます。無制限の単語を使用するには、プロサブスクリプション(月額10ドル)が必要です。 - データ・セキュリティはどのように確保するのですか?
音声と画面のデータはクラウドにアップロードされることなくローカルで処理され、ユーザーの許可なく情報が保存されることはない。 - どのような用途に使用できますか?
Aqua Voiceは、Notion、Slack、VSCode、Gmail、WhatsAppなどをサポートしています。 - 独自の用語にはどのように対処していますか?
会社名や専門用語などのカスタム辞書を設定に追加すると、ソフトウェアが優先的に認識します。