아쿠아 보이스: 정확한 텍스트 생성을 위한 애플리케이션 간 음성 입력

최신 AI 리소스4 개월 전에 게시 됨 AI 공유 서클
2.1K 00

일반 소개

아쿠아 보이스는 사용자의 음성을 형식화된 텍스트로 빠르게 변환하는 데 중점을 둔 지능형 음성 기반 텍스트 생성 도구입니다. 2023년 피니언 브라운과 잭 매킨타이어가 설립하고 미국 샌프란시스코에 본사를 두고 있으며, Y Combinator W24 인큐베이션 프로그램의 일환으로 설립된 Aqua Voice는 음성을 정확하게 전사할 뿐만 아니라 문맥에 따라 사용자의 의도를 이해하여 자동으로 텍스트 서식을 지정하여 이메일, 코드 또는 메시지와 같은 콘텐츠를 생성합니다. 시작 시간이 200밀리초 미만, 텍스트 출력 지연 시간이 450밀리초로 짧고 오류율이 Siri 및 Google 음성 입력보다 약 17배 낮은 등 반응성이 뛰어납니다. Mac과 Windows를 지원하므로 추가 플러그인 없이 다양한 앱에서 사용할 수 있어 텍스트 작업을 효율적으로 처리해야 하는 사용자에게 이상적입니다.

Aqua Voice:跨应用语音输入生成精准文本

 

기능 목록

  • 고정밀 음성 전사음성을 실시간으로 텍스트로 변환하여 맞춤법, 문법 및 서식을 자동으로 수정합니다.
  • 자연어 교육"목록으로 변경" 또는 "표 삽입"과 같은 간단한 구두 지시를 통해 텍스트를 조정합니다.
  • 상황에 맞는화면 콘텐츠 또는 문서 컨텍스트에 따라 지능적으로 정보를 보완하거나 출력을 최적화합니다.
  • 초저지연시작 시간은 200밀리초 미만이며, 고속 모드 출력 지연은 약 450밀리초입니다.
  • 스트리밍 모드복잡한 작업을 위해 약 850밀리초의 지연 시간으로 연속 음성 입력을 지원합니다.
  • 애플리케이션 간 호환성플러그인 없이 Notion, Slack, VSCode 등의 앱에 직접 텍스트를 입력할 수 있습니다.
  • 코드 이해구문 강조 표시 및 용어 수정을 지원하여 개발자를 위한 코드 관련 트랜스크립션을 최적화합니다.
  • 사용자 지정 사전정확한 필사를 위해 독점 어휘(예: 이름, 전문 용어)를 추가합니다.
  • 개인정보 보호데이터는 로컬에서 처리되며 개인정보와 보안을 보호하기 위해 사용자 데이터는 저장되지 않습니다.

 

도움말 사용

설치 프로세스

  1. 공식 웹사이트(https://withaqua.com/)를 방문하여 페이지 상단의 '다운로드' 버튼을 클릭합니다.
  2. 운영 체제에 따라 버전을 선택하세요:
    • Mac 사용자는 Apple Silicon 또는 Intel 버전을 선택합니다.
    • Windows 사용자는 일반 설치 패키지를 직접 다운로드합니다.
  3. 다운로드가 완료되면 설치 패키지를 두 번 클릭하고 지시에 따라 설치를 완료합니다. 전체 과정은 보통 3~5분 정도 걸립니다.
  4. 아쿠아 보이스를 실행하면 소프트웨어가 자동으로 마이크를 감지하고 연결을 요청하는 메시지를 표시합니다. 문제가 발생하면 공식 웹사이트의 FAQ에서 해결 방법을 확인할 수 있습니다.
  5. 처음 사용자는 계정에 가입해야 하며, 무료 버전은 1,000단어 평가판을 제공합니다. 평가판 사용 후에는 프로 버전(월 $10 또는 연간 $96)을 구독할 수 있습니다.

사용 방법

아쿠아 보이스의 핵심은 음성으로 텍스트를 빠르게 생성하고 편집할 수 있는 기능으로, 사용하기 쉽고 다양한 시나리오에 적합합니다. 아래는 사용법에 대한 자세한 가이드입니다:

기본 음성 입력

  1. 아쿠아 보이스를 열고 마이크 아이콘을 클릭하거나 기본 단축키를 누릅니다. Ctrl+Space(사용자 지정 가능) 녹화를 시작합니다.
  2. "내일 회의가 취소되었음을 설명하는 이메일을 Sarah에게 작성하세요."와 같이 말합니다. 소프트웨어가 서식이 지정된 텍스트를 생성합니다:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
  1. 짧은 일시 정지는 자동으로 세그먼트화되며 마이크 아이콘을 길게 누르면 녹음이 종료됩니다.

자연어 지침 사용

아쿠아 보이스는 간단한 명령으로 텍스트 서식을 지정할 수 있습니다. 예를 들어

  • "목록으로 변경"이라고 말하면 텍스트가 변경됩니다:
- 明天原定的会议已取消
- 请知悉
  • "양식 삽입"이라고 말하여 생성합니다:
| 任务     | 状态   |
|----------|--------|
| 会议     | 取消   |
  • "이 단락을 줄여주세요"라고 말하면 소프트웨어는 예를 들어 "수신을 확인하고 승인해 주세요"를 "확인해주세요"로 바꾸는 등 문장을 간소화합니다.
    지침은 명확해야 하며 복잡한 문장은 피해야 합니다. 예를 들어 "이 부분을 더 간결하게 만드세요"가 "텍스트 구조를 최적화하세요"보다 더 쉽게 알아볼 수 있습니다.

애플리케이션 간 사용

아쿠아 보이스는 플러그인 없이도 여러 애플리케이션에서 작동합니다:

  1. Slack, Notion 또는 Gmail에서 바로 가기 키를 눌러 아쿠아 보이스를 활성화합니다.
  2. "존에게 답장하고 프로젝트가 완료되었다고 알려줘"와 같은 말을 합니다. 소프트웨어가 직접 입력합니다:
嗨 John,项目已经完成,请确认。
  1. 완료되면 수동으로 보내거나 "보내기"라고 말하여 앱 내 보내기 기능을 실행할 수 있습니다(앱 지원 필요).

주요 기능 작동

  1. 상황에 맞는
    Aqua Voice는 화면 콘텐츠를 통해 문맥을 이해합니다. 예시:
  • 코드를 작성할 때 "댓글 추가"라고 말하면 다음과 같은 내용이 생성됩니다. // 初始化用户数据 주석.
  • 이메일에서 "날짜 입력"이라고 말하면 현재 날짜가 삽입됩니다(예: "2025년 4월 10일").
  • 사람의 이름(예: "Tom")이 언급되는 경우 철자 오류를 최소화하기 위해 화면의 연락처 목록을 참조합니다.
  1. 코드 이해 및 구문 강조 표시
    개발자를 위해 Aqua Voice는 기술 용어를 인식하고 출력을 최적화합니다:
  • "ID 매개 변수를 수락하는 getUserData 함수 만들기"라고 말하면 함수가 생성됩니다:
    async function getUserData(id) {
    const response = await fetch(`/users/${id}`);
    return response.json();
    }
    
  • "Jason"을 "JSON"으로 변경하는 등 용어를 자동으로 수정합니다.
  1. 스트리밍 모드와 고속 모드 비교
  • 빠른 모드(즉시 모드): 약 450밀리초의 지연이 있는 짧은 문장 입력에 적합합니다. 텍스트는 말한 직후에 출력됩니다.
  • 스트리밍 모드(스트리밍 모드): 긴 단락이나 복잡한 작업에 적합하며 지연 시간은 약 850밀리초입니다. 말하면서 생성: 긴 문서를 받아쓰기에 적합합니다.
  • 모드 전환: 설정에서 선택하거나 "스트리밍 모드로 전환"이라고 말합니다.
  1. 사용자 지정 사전
  • 설정에 "Grok" 또는 "xAI"와 같은 독점 단어를 추가하여 정확한 전사를 보장하세요.
  • 예: "Grok"을 추가한 후 "Grok은 AI 비서입니다"라고 하면 "Grock"으로 철자가 틀리게 입력되지 않습니다.
  1. 개인정보 보호 및 보안
  • 모든 음성 데이터는 클라우드에 업로드되지 않고 로컬에서 처리됩니다.
  • 화면 컨텍스트 분석은 출력을 최적화하는 데만 사용되며 어떠한 정보도 저장되지 않습니다.

주의

  • 배경 소음이 필사 정확도를 방해하지 않도록 마이크의 음질이 좋은지 확인하세요.
  • 현재는 영어만 지원하며 중국어 음성 입력은 당분간 지원되지 않지만, 개발팀은 다국어 기능을 개발 중이라고 밝혔습니다.
  • 네트워크 연결은 상황 인식을 향상시키지만 오프라인 모드는 기본 기능에 적합하게 작동합니다.
  • 공식 웹사이트(https://withaqua.com/changelog)에서 최신 업데이트를 정기적으로 확인하면 소프트웨어에서 자동으로 새 버전을 묻는 메시지가 표시됩니다.

고급 기술

  • 복잡한 문서 서식:: 제목, 본문, 결론이 포함된 구조화된 텍스트를 생성하는 '보고서로 서식 지정'을 말합니다.
  • 멀티태스킹스트리밍 모드에서 "Anna에게 계획을 설명하는 이메일 쓰기, 할 일 목록 만들기"라고 말하면 소프트웨어가 차례대로 수행합니다.
  • 바로 가기 최적화: 설정에서 바로 가기를 조정합니다. Ctrl+Space 로 변경 Alt+V운영 효율성을 향상시킵니다.

이러한 기능을 통해 사용자는 간단한 메시지부터 복잡한 코드까지 음성으로 쉽게 편집할 수 있어 수동 입력 시간을 대폭 줄일 수 있습니다.

 

애플리케이션 시나리오

  1. 직장에서의 효과적인 커뮤니케이션
    시나리오 설명: 바쁜 관리자가 회의 중간에 여러 개의 이메일에 응답해야 합니다. 아쿠아 보이스를 사용하여 이메일 콘텐츠를 받아쓰면 소프트웨어가 바로 보낼 수 있는 서식이 지정된 텍스트를 자동으로 생성하여 시간을 절약하세요.
  2. 개발자를 위한 빠른 코딩
    시나리오 설명: 프로그래머가 "REST API 엔드포인트 만들기"와 같은 코드 로직을 지시하면 Aqua Voice가 정확한 코드 스니펫을 생성하여 수동 키보드 입력의 필요성을 줄여줍니다.
  3. 학생 수업 노트
    시나리오 설명: 학생들이 음성으로 강의를 녹음하고 "개요로 정리해줘"라고 말하면 수업 후 쉽게 정리할 수 있도록 복습 자료를 빠르게 생성할 수 있습니다.
  4. 접근성 보조 도구
    시나리오 설명: 타이핑이 어려운 사용자가 음성으로 컴퓨터를 편리하게 조작하여 메시지 전송이나 문서 편집을 완료하여 생활 및 업무 효율성을 높일 수 있습니다.

 

QA

  1. 아쿠아 보이스는 중국어 음성을 지원하나요?
    현재 영어만 지원되며 중국어 기능은 개발 중입니다. 공식 웹사이트 https://withaqua.com/blog 에서 업데이트를 확인할 수 있습니다.
  2. 무료 버전의 제한 사항은 무엇인가요?
    무료 버전은 1000단어 평가판과 5개의 사용자 지정 사전 슬롯을 제공합니다. 무제한 단어를 사용하려면 Pro 구독(월 $10)이 필요합니다.
  3. 데이터 보안은 어떻게 보장하나요?
    음성 및 화면 데이터는 클라우드에 업로드되지 않고 로컬에서 처리되며, 사용자의 허락 없이 어떠한 정보도 저장되지 않습니다.
  4. 어떤 애플리케이션에서 사용할 수 있나요?
    아쿠아 보이스는 노션, 슬랙, VSCode, Gmail, WhatsApp 등을 지원합니다. 추가 플러그인 없이 바로 텍스트를 입력할 수 있습니다.
  5. 독점적 용어는 어떻게 처리하나요?
    설정에서 회사 이름이나 기술 용어와 같은 사용자 지정 사전을 추가하면 소프트웨어가 이를 우선 순위로 인식합니다.
© 저작권 정책
AiPPT

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...