综合介绍
Aqua Voice 是一个基于语音的智能文本生成工具,专注于将用户语音快速转化为格式化文本。它由 Finnian Brown 和 Jack McIntire 创建于2023年,总部位于美国旧金山,隶属于 Y Combinator W24 孵化项目。Aqua Voice 不仅能准确转写语音,还能根据上下文理解用户意图,自动调整文本格式,生成邮件、代码或消息等内容。它的响应速度快,启动时间不到 200 毫秒,文本输出延迟低至 450 毫秒,错误率比 Siri 和 Google 语音输入低约 17 倍。支持 Mac 和 Windows 系统,无需额外插件即可在多种应用中使用,适合需要高效完成文字工作的用户。
功能列表
- 高精度语音转写:将语音实时转化为文本,自动修正拼写、语法和格式。
- 自然语言指令:用简单口头指令调整文本,如“改成列表”或“插入表格”。
- 上下文感知:根据屏幕内容或文档上下文,智能补充信息或优化输出。
- 超低延迟:启动时间低于 200 毫秒,快速模式输出延迟约 450 毫秒。
- 流式模式:支持连续语音输入,延迟约 850 毫秒,适合复杂任务。
- 跨应用兼容:无需插件,直接在 Notion、Slack、VSCode 等应用中输入文本。
- 代码理解:为开发者优化代码相关转写,支持语法高亮和术语纠正。
- 自定义词典:添加专有词汇(如人名、技术术语),确保转写准确。
- 隐私保护:数据本地处理,不存储用户数据,保障隐私安全。
使用帮助
安装流程
- 访问官网 https://withaqua.com/,点击页面顶部的“Download”按钮。
- 根据你的操作系统选择版本:
- Mac 用户选择 Apple Silicon 或 Intel 版本。
- Windows 用户直接下载通用安装包。
- 下载完成后,双击安装包,按提示完成安装。整个过程通常只需 3-5 分钟。
- 启动 Aqua Voice,软件会自动检测麦克风并提示连接。如有问题,可在官网 FAQ 查看解决方案。
- 首次使用需注册账户,免费版提供 1000 字的试用额度。试用后可选择订阅 Pro 版(每月 10 美元或年付 96 美元)。
如何使用
Aqua Voice 的核心是通过语音快速生成和编辑文本,操作简单,适合多种场景。以下是详细使用指南:
基本语音输入
- 打开 Aqua Voice,点击麦克风图标或按默认快捷键
Ctrl+Space
(可自定义)开始录音。 - 说出内容,比如“写一封邮件给 Sarah,说明明天会议取消”。软件会生成格式化的文本:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
- 短暂停顿会自动分段,长按麦克风图标可结束录音。
使用自然语言指令
Aqua Voice 支持用简单指令调整文本格式。例如:
- 说“改成列表”,文本会变成:
- 明天原定的会议已取消
- 请知悉
- 说“插入表格”,可生成:
| 任务 | 状态 |
|----------|--------|
| 会议 | 取消 |
- 说“缩短这段”,软件会精简文本,比如将“请知悉并确认收到”改为“请确认”。
指令要清晰,避免复杂语句。例如,“把这部分改得更简洁”比“优化文本结构”更容易被识别。
跨应用使用
Aqua Voice 无需插件即可在多种应用中运行:
- 在 Slack、Notion 或 Gmail 中,按快捷键激活 Aqua Voice。
- 说出内容,比如“回复 John,告诉他项目已完成”。软件会直接输入:
嗨 John,项目已经完成,请确认。
- 完成后可手动发送,或说“发送”触发应用内发送功能(需应用支持)。
特色功能操作
- 上下文感知
Aqua Voice 通过屏幕内容理解上下文。例如:
- 在写代码时说“添加注释”,它会根据代码生成类似
// 初始化用户数据
的注释。 - 在邮件中说“填入日期”,它会插入当前日期,如“2025年4月10日”。
- 如果提到人名(如“Tom”),它会参考屏幕上的联系人列表,减少拼写错误。
- 代码理解与语法高亮
对于开发者,Aqua Voice 能识别技术术语并优化输出:
- 说“创建函数 getUserData,接受 ID 参数”,会生成:
async function getUserData(id) { const response = await fetch(`/users/${id}`); return response.json(); }
- 自动纠正术语,比如将“Jason”改为“JSON”。
- 流式模式与快速模式
- 快速模式(Instant Mode):适合短句输入,延迟约 450 毫秒。说出内容后,文本立即输出。
- 流式模式(Streaming Mode):适合长段落或复杂任务,延迟约 850 毫秒。边说边生成,适合口述长文档。
- 切换模式:在设置中选择,或说“切换到流式模式”。
- 自定义词典
- 在设置中添加专有词汇,如“Grok”或“xAI”,确保准确转写。
- 示例:添加“Grok”后,说“Grok 是 AI 助手”,不会误写为“Grock”。
- 隐私与安全
- 所有语音数据在本地处理,不上传云端。
- 屏幕上下文分析仅用于优化输出,不会存储任何信息。
注意事项
- 确保麦克风质量良好,避免背景噪音干扰转写准确性。
- 目前仅支持英语,中文语音输入暂不支持,但开发团队表示正在开发多语言功能。
- 网络连接可提升上下文感知效果,但离线模式也能正常使用基本功能。
- 定期检查官网 https://withaqua.com/changelog 获取最新更新,软件会自动提示新版本。
进阶技巧
- 复杂文档格式化:说“格式化成报告”,可生成带标题、正文和结论的结构化文本。
- 多任务处理:在流式模式下,连续说“写邮件给 Anna,说明计划;然后创建待办列表”,软件会依次完成。
- 快捷键优化:在设置中调整快捷键,如将
Ctrl+Space
改为Alt+V
,提升操作效率。
通过这些功能,用户可以轻松用语音完成从简单消息到复杂代码的编辑,大幅减少手动输入时间。
应用场景
- 职场高效沟通
场景描述:忙碌的经理需要在会议间隙回复多封邮件。使用 Aqua Voice 口述邮件内容,软件自动生成格式化文本,直接发送,节省时间。 - 开发者快速编码
场景描述:程序员口述代码逻辑,如“创建 REST API 端点”,Aqua Voice 生成准确的代码片段,减少手动敲键盘的麻烦。 - 学生课堂笔记
场景描述:学生用语音记录讲课内容,说“整理成大纲”,快速生成复习资料,方便课后整理。 - 无障碍辅助工具
场景描述:无法方便打字的用户通过语音操作电脑,完成消息发送或文档编辑,提升生活和工作效率。
QA
- Aqua Voice 支持中文语音吗?
目前仅支持英语,中文功能正在开发中。可关注官网 https://withaqua.com/blog 获取更新。 - 免费版有什么限制?
免费版提供 1000 字试用额度和 5 个自定义词典名额。无限字数需订阅 Pro 版(每月 10 美元)。 - 如何确保数据安全?
语音和屏幕数据在本地处理,不上传云端,未经用户许可不会存储任何信息。 - 可以在哪些应用中使用?
Aqua Voice 支持 Notion、Slack、VSCode、Gmail、WhatsApp 等,无需额外插件,直接输入文本。 - 如何处理专有术语?
在设置中添加自定义词典,比如公司名称或技术术语,软件会优先识别这些词汇。