Aqua Voice: генерация точного текста с помощью речевого ввода в различных приложениях
Общее введение
Aqua Voice - это интеллектуальный инструмент для создания текста на основе речи, ориентированный на быстрое преобразование речи пользователя в форматированный текст. Основанная в 2023 году Финнианом Брауном и Джеком Макинтайром и расположенная в Сан-Франциско, США, в рамках программы инкубации Y Combinator W24, Aqua Voice не только точно транскрибирует речь, но и понимает намерения пользователя на основе контекста, автоматически форматируя текст для создания такого контента, как электронные письма, код или сообщения. Он быстро реагирует на запросы, время запуска составляет менее 200 миллисекунд, задержка вывода текста - 450 миллисекунд, а количество ошибок в 17 раз меньше, чем при голосовом вводе Siri и Google. Благодаря поддержке Mac и Windows его можно использовать в широком спектре приложений без дополнительных плагинов, что делает его идеальным для пользователей, которым необходимо эффективно выполнять текстовую работу.

Список функций
- Высокоточная транскрипция речи: Преобразует речь в текст в режиме реального времени, автоматически исправляя орфографию, грамматику и форматирование.
- обучение на естественном языке: Корректируйте текст с помощью простых словесных инструкций, таких как "перейти к списку" или "вставить таблицу".
- контекстно-зависимый: Интеллектуальное дополнение информации или оптимизация вывода на основе содержимого экрана или контекста документа.
- сверхнизкая задержка: Время запуска составляет менее 200 миллисекунд, а задержка выхода в быстром режиме - около 450 миллисекунд.
- потоковый режим: Поддерживает непрерывный голосовой ввод с задержкой около 850 миллисекунд для выполнения сложных задач.
- Совместимость с другими приложениями: Вводите текст напрямую в такие приложения, как Notion, Slack, VSCode и другие, без использования плагина.
- Понимание кода: Оптимизация транскрипции кода для разработчиков с поддержкой подсветки синтаксиса и исправления терминологии.
- Пользовательский словарь: Добавьте фирменную лексику (например, названия, технические термины) для обеспечения точности транскрипции.
- Конфиденциальность: Данные обрабатываются локально, и никакие пользовательские данные не хранятся для обеспечения конфиденциальности и безопасности.
Использование помощи
Процесс установки
- Зайдите на официальный сайт https://withaqua.com/ и нажмите кнопку "Скачать" в верхней части страницы.
- Выберите версию в соответствии с вашей операционной системой:
- Пользователи Mac выбирают версию Apple Silicon или Intel.
- Пользователи Windows загружают общий установочный пакет напрямую.
- После завершения загрузки дважды щелкните на установочном пакете и следуйте подсказкам, чтобы завершить установку. Весь процесс обычно занимает всего 3-5 минут.
- Запустите Aqua Voice, и программа автоматически обнаружит микрофон и запросит подключение. Если у вас возникнут проблемы, вы можете обратиться к FAQ на официальном сайте, чтобы найти решение.
- Для первых пользователей необходимо зарегистрировать учетную запись, а бесплатная версия предлагает пробную версию на 1000 слов. После пробной версии вы можете подписаться на версию Pro (10 долларов в месяц или 96 долларов в год).
Как использовать
В основе Aqua Voice лежит возможность быстрого создания и редактирования текста голосом, которая проста в использовании и подходит для самых разных сценариев. Ниже приведено подробное руководство по его использованию:
Базовый голосовой ввод
- Откройте Aqua Voice и щелкните на значке микрофона или нажмите клавишу быстрого доступа по умолчанию
Ctrl+Space
(настраивается) Начало записи. - Скажите что-то вроде "Напишите письмо Саре, объяснив, что завтрашняя встреча отменяется". Программа генерирует отформатированный текст:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
- Короткие паузы автоматически сегментируются, а длительное нажатие на значок микрофона завершает запись.
Использование инструкций на естественном языке
Aqua Voice поддерживает форматирование текста с помощью простых команд. Например:
- Скажите "изменить на список", и текст изменится:
- 明天原定的会议已取消
- 请知悉
- Для создания формы скажите "Вставить форму":
| 任务 | 状态 |
|----------|--------|
| 会议 | 取消 |
- Если вы скажете "сократить этот абзац", программа оптимизирует текст, например, заменив "Пожалуйста, подтвердите получение" на "Пожалуйста, подтвердите".
Инструкции должны быть четкими и не содержать сложных формулировок. Например, "Сделайте эту часть более лаконичной" легче распознать, чем "Оптимизируйте структуру текста".
Межприкладное использование
Aqua Voice работает в различных приложениях без плагинов:
- В Slack, Notion или Gmail нажмите клавишу быстрого доступа, чтобы активировать Aqua Voice.
- Скажите что-то вроде "Ответить Джону и сообщить ему, что проект завершен". Программа введет его напрямую:
嗨 John,项目已经完成,请确认。
- После этого вы можете отправить его вручную или сказать "Отправить", чтобы запустить функцию отправки в приложении (требуется поддержка приложения).
Функциональное управление
- контекстно-зависимый
Aqua Voice понимает контекст через экранный контент. Например:
- Скажите "добавить комментарий" при написании кода, и он сгенерирует что-то вроде
// 初始化用户数据
Аннотации. - В электронном письме укажите "Заполнить дату", и оно вставит текущую дату, например "10 апреля 2025 года".
- Если упоминается имя человека (например, "Том"), он обращается к списку контактов на экране, чтобы свести к минимуму орфографические ошибки.
- Понимание кода и подсветка синтаксиса
Для разработчиков Aqua Voice распознает технические термины и оптимизирует вывод информации:
- Если сказать "Создать функцию getUserData, принимающую параметр ID", то будет сгенерирована функция getUserData:
async function getUserData(id) { const response = await fetch(`/users/${id}`); return response.json(); }
- Автоматически исправляет терминологию, например, меняет "Jason" на "JSON".
- Потоковый режим против быстрого режима
- быстрый режим(Мгновенный режим): подходит для ввода коротких предложений с задержкой около 450 миллисекунд. Текст выводится сразу после произнесения.
- потоковый режим(Потоковый режим): для длинных абзацев или сложных задач, с задержкой около 850 миллисекунд. Генерировать как речь, подходит для диктовки длинных документов.
- Режим переключения: выберите в настройках или скажите "Переключиться в режим потоковой передачи".
- Пользовательский словарь
- Добавьте в настройки такие фирменные слова, как "Grok" или "xAI", чтобы обеспечить точность транскрипции.
- Пример: после добавления слова "Grok" фраза "Grok - это помощник искусственного интеллекта" не будет произноситься как "Grock".
- Конфиденциальность и безопасность
- Все голосовые данные обрабатываются локально и не загружаются в облако.
- Анализ контекста экрана используется только для оптимизации вывода, и никакая информация не сохраняется.
предостережение
- Убедитесь, что микрофон хорошего качества, чтобы фоновый шум не мешал точности транскрипции.
- В настоящее время поддерживается только английский язык, китайский голосовой ввод пока не поддерживается, но команда разработчиков заявила, что разрабатывает мультиязычные функции.
- Подключение к сети улучшает контекстную осведомленность, но автономный режим отлично подходит для основных функций.
- Регулярно проверяйте официальный сайт https://withaqua.com/changelog на наличие последних обновлений, и программа будет автоматически запрашивать новые версии.
продвинутый навык
- Сложное форматирование документов:: Скажите "Форматировать как отчет", что приведет к созданию структурированного текста с заголовком, телом и заключением.
- многозадачность: В потоковом режиме скажите: "Напишите письмо Анне, объяснив свои планы; затем создайте список дел", и программа выполнит все по очереди.
- Оптимизация быстрого доступа: Настройте ярлыки в настройках, например, установив
Ctrl+Space
превратиться вAlt+V
Повышение эффективности работы.
Благодаря этим функциям пользователи могут легко использовать голос для редактирования от простых сообщений до сложного кода, что значительно сокращает время ручного ввода.
сценарий применения
- Эффективная коммуникация на рабочем месте
Описание сценария: Занятому менеджеру необходимо ответить на множество электронных писем в перерывах между встречами. Сэкономьте время, используя Aqua Voice для диктовки содержимого электронной почты, и программа автоматически сгенерирует отформатированный текст, который можно отправить напрямую. - Быстрое кодирование для разработчиков
Описание сценария: Программисты диктуют логику кода, например "Создать конечную точку REST API", а Aqua Voice генерирует точный фрагмент кода, сокращая необходимость в ручном наборе текста. - Конспекты занятий для студентов
Описание сценария: Студенты записывают лекции голосом и говорят "Организовать в конспект", чтобы быстро создать материалы для ревизии и легко организовать их после занятий. - Средства обеспечения доступности
Описание сценария: Пользователи, которые не умеют печатать, удобно управляют компьютером с помощью голоса для отправки сообщений или редактирования документов, чтобы повысить эффективность своей жизни и работы.
QA
- Поддерживает ли Aqua Voice китайский голос?
В настоящее время поддерживается только английский язык, функция китайского языка находится в разработке. Вы можете следить за обновлениями на официальном сайте https://withaqua.com/blog. - Каковы ограничения бесплатной версии?
Бесплатная версия предлагает пробную версию на 1000 слов и 5 слотов для пользовательских словарей. Для неограниченного количества слов требуется подписка Pro (10 долларов в месяц). - Как вы обеспечиваете безопасность данных?
Голосовые и экранные данные обрабатываются локально, а не загружаются в облако, и никакая информация не хранится без разрешения пользователя. - В каких областях его можно использовать?
Aqua Voice поддерживает Notion, Slack, VSCode, Gmail, WhatsApp и т. д. Вводите текст напрямую, без дополнительных плагинов. - Как вы справляетесь с терминами запатентованной продукции?
Добавьте в настройках пользовательские словари, например, названий компаний или технических терминов, и программа будет распознавать эти слова по преимуществу.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...