Aprendizagem pessoal com IA
e orientação prática
TRAE

Aqua Voice: entrada de voz entre aplicativos para gerar texto preciso

Introdução geral

O Aqua Voice é uma ferramenta inteligente de geração de texto baseada em fala, focada na conversão rápida da fala do usuário em texto formatado. Fundada em 2023 por Finnian Brown e Jack McIntire, e com sede em São Francisco, EUA, como parte do programa de incubação Y Combinator W24, a Aqua Voice não apenas transcreve a fala com precisão, mas também entende a intenção do usuário com base no contexto, formatando automaticamente o texto para gerar conteúdo como e-mails, códigos ou mensagens. Ele é ágil, com um tempo de inicialização inferior a 200 milissegundos, uma latência de saída de texto tão baixa quanto 450 milissegundos e uma taxa de erro cerca de 17 vezes menor do que a entrada de voz da Siri e do Google. Com suporte para Mac e Windows, ele pode ser usado em uma grande variedade de aplicativos sem plug-ins adicionais, o que o torna ideal para usuários que precisam trabalhar com texto de forma eficiente.

Aqua Voice: entrada de fala entre aplicativos para gerar texto preciso-1


 

Lista de funções

  • Transcrição de fala de alta precisãoConverte a fala em texto em tempo real, corrigindo automaticamente a ortografia, a gramática e a formatação.
  • ensino de linguagem naturalAjuste o texto com instruções verbais simples, como "mudar para lista" ou "inserir tabela".
  • sensível ao contextoInformações complementares inteligentes ou otimização da saída com base no conteúdo da tela ou no contexto do documento.
  • latência ultrabaixaTempo de inicialização: menos de 200 milissegundos, com um atraso de saída no modo rápido de aproximadamente 450 milissegundos.
  • modo de transmissãoSuporte para entrada de voz contínua com uma latência de aproximadamente 850 milissegundos para tarefas complexas.
  • Compatibilidade entre aplicativosInsira texto diretamente em aplicativos como Notion, Slack, VSCode e outros sem um plug-in.
  • Compreensão do códigoOtimize a transcrição relacionada ao código para desenvolvedores, com suporte para realce de sintaxe e correção de terminologia.
  • Dicionário personalizadoAdicionar vocabulário proprietário (por exemplo, nomes, termos técnicos) para garantir uma transcrição precisa.
  • PrivacidadeDados: Os dados são processados localmente e nenhum dado do usuário é armazenado para proteger a privacidade e a segurança.

 

Usando a Ajuda

Processo de instalação

  1. Visite o site oficial https://withaqua.com/ e clique no botão "Download" na parte superior da página.
  2. Escolha a versão de acordo com seu sistema operacional:
    • Os usuários de Mac escolhem a versão Apple Silicon ou Intel.
    • Os usuários do Windows baixam diretamente o pacote de instalação genérico.
  3. Quando o download estiver concluído, clique duas vezes no pacote de instalação e siga as instruções para concluir a instalação. Normalmente, todo o processo leva apenas de 3 a 5 minutos.
  4. Inicie o Aqua Voice e o software detectará automaticamente o microfone e solicitará uma conexão. Se tiver algum problema, consulte as perguntas frequentes no site oficial para obter soluções.
  5. Os usuários iniciantes precisam se inscrever para criar uma conta, e a versão gratuita oferece uma avaliação de 1.000 palavras. Após a avaliação, você pode optar por assinar a versão Pro (US$ 10 por mês ou US$ 96 por ano).

Como usar

No centro do Aqua Voice está a capacidade de gerar e editar rapidamente texto por voz, o que é fácil de usar e adequado para uma ampla gama de cenários. Veja abaixo um guia detalhado de como usá-lo:

Entrada de voz básica

  1. Abra o Aqua Voice e clique no ícone do microfone ou pressione a tecla de atalho padrão Ctrl+Space(Personalizável) Inicia a gravação.
  2. Diga algo como "Escreva um e-mail para Sarah explicando que a reunião de amanhã foi cancelada". O software gera o texto formatado:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
  1. As pausas curtas são segmentadas automaticamente, e pressionar longamente o ícone do microfone encerra a gravação.

Uso de instruções em linguagem natural

O Aqua Voice suporta a formatação de texto com comandos simples. Por exemplo:

  • Diga "change to list" e o texto será alterado:
- 明天原定的会议已取消
- 请知悉
  • Diga "Insert Form" (Inserir formulário) para gerar:
| 任务     | 状态   |
|----------|--------|
| 会议     | 取消   |
  • Quando você disser "encurtar este parágrafo", o software simplificará o texto, por exemplo, substituindo "Favor confirmar o recebimento" por "Favor confirmar".
    As instruções devem ser claras e evitar declarações complexas. Por exemplo, "Torne esta parte mais concisa" é mais facilmente reconhecido do que "Otimize a estrutura do texto".

Uso entre aplicativos

O Aqua Voice funciona em vários aplicativos sem plug-ins:

  1. No Slack, Notion ou Gmail, pressione a tecla de atalho para ativar o Aqua Voice.
  2. Diga algo como "Responda ao John e diga a ele que o projeto está concluído". O software o registrará diretamente:
嗨 John,项目已经完成,请确认。
  1. Uma vez concluído, você pode enviá-lo manualmente ou dizer "Send" (Enviar) para acionar a função de envio no aplicativo (é necessário suporte ao aplicativo).

Operação da função em destaque

  1. sensível ao contexto
    O Aqua Voice entende o contexto por meio do conteúdo na tela. Por exemplo:
  • Diga "add comment" (adicionar comentário) ao escrever o código, e ele gerará algo como // 初始化用户数据 As anotações.
  • No e-mail, diga "Fill in the date" (Preencha a data) e ele inserirá a data atual, por exemplo, "10 April 2025" (10 de abril de 2025).
  • Se o nome de uma pessoa for mencionado (por exemplo, "Tom"), ele fará referência à lista de contatos na tela para minimizar erros de ortografia.
  1. Compreensão de código e destaque de sintaxe
    Para os desenvolvedores, o Aqua Voice reconhece termos técnicos e otimiza a produção:
  • Dizer "Criar função getUserData, aceitando o parâmetro ID" gerará:
    async function getUserData(id) {
    const response = await fetch(`/users/${id}`);
    return response.json();
    }
    
  • Corrige automaticamente a terminologia, como a alteração de "Jason" para "JSON".
  1. Modo de streaming vs. modo rápido
  • modo rápido(Modo instantâneo): adequado para a entrada de frases curtas com um atraso de cerca de 450 milissegundos. O texto é emitido imediatamente após ser falado.
  • modo de transmissão(Modo de fluxo contínuo): para parágrafos longos ou tarefas complexas, com um atraso de cerca de 850 ms. Gerar como você fala, adequado para ditar documentos longos.
  • Alternar modo: Selecione nas configurações ou diga "Alternar para o modo de streaming".
  1. Dicionário personalizado
  • Adicione palavras proprietárias, como "Grok" ou "xAI", às suas configurações para garantir uma transcrição precisa.
  • Exemplo: depois de adicionar "Grok", diga "Grok is an AI assistant" (Grok é um assistente de IA), que não será escrito incorretamente como "Grock".
  1. Privacidade e segurança
  • Todos os dados de voz são processados localmente e não são carregados na nuvem.
  • A análise do contexto da tela é usada apenas para otimizar a saída e nenhuma informação é armazenada.

advertência

  • Certifique-se de que o microfone seja de boa qualidade para evitar que o ruído de fundo interfira na precisão da transcrição.
  • No momento, a entrada de voz em inglês e chinês não é compatível por enquanto, mas a equipe de desenvolvimento disse que está desenvolvendo recursos em vários idiomas.
  • A conectividade de rede melhora a percepção do contexto, mas o modo off-line funciona bem para funções básicas.
  • Verifique regularmente o site oficial https://withaqua.com/changelog para obter as atualizações mais recentes e o software solicitará automaticamente novas versões.

habilidade avançada

  • Formatação de documentos complexos:: Diga "Format as Report", que gera um texto estruturado com título, corpo e conclusão.
  • multitarefaNo modo de transmissão, diga "Escreva um e-mail para Anna explicando seus planos; em seguida, crie uma lista de tarefas" e o software fará isso por sua vez.
  • Otimização de atalhos: Ajuste os atalhos nas configurações, por exemplo, definindo o Ctrl+Space mudar para Alt+Vaumentar a eficiência operacional.

Com esses recursos, os usuários podem usar facilmente a voz para concluir edições de mensagens simples a códigos complexos, reduzindo drasticamente o tempo de entrada manual.

 

cenário do aplicativo

  1. Comunicação eficaz no local de trabalho
    Descrição do cenário: um gerente ocupado precisa responder a vários e-mails entre uma reunião e outra. Economize tempo usando o Aqua Voice para ditar o conteúdo do e-mail e o software gera automaticamente um texto formatado que pode ser enviado diretamente.
  2. Codificação rápida para desenvolvedores
    Descrição do cenário: os programadores ditam a lógica do código, como "Criar ponto de extremidade da API REST", e o Aqua Voice gera o trecho exato do código, reduzindo a necessidade de digitação manual.
  3. Anotações do aluno em sala de aula
    Descrição do cenário: os alunos gravam palestras por voz e dizem "organize em um esboço" para gerar rapidamente materiais de revisão para facilitar a organização após a aula.
  4. Auxílios de acessibilidade
    Descrição do cenário: os usuários que não sabem digitar operam seus computadores convenientemente por voz para concluir o envio de mensagens ou a edição de documentos para melhorar sua vida e eficiência no trabalho.

 

QA

  1. O Aqua Voice é compatível com voz em chinês?
    Atualmente, apenas o inglês é suportado, a função chinesa está em desenvolvimento. Você pode acompanhar o site oficial https://withaqua.com/blog para obter atualizações.
  2. Quais são as limitações da versão gratuita?
    A versão gratuita oferece uma avaliação de 1.000 palavras e 5 espaços de dicionário personalizados. Palavras ilimitadas requerem uma assinatura Pro (US$ 10 por mês).
  3. Como você garante a segurança dos dados?
    Os dados de voz e de tela são processados localmente, não são carregados na nuvem, e nenhuma informação é armazenada sem a permissão do usuário.
  4. Em quais aplicações ele pode ser usado?
    O Aqua Voice é compatível com Notion, Slack, VSCode, Gmail, WhatsApp, etc. Digite o texto diretamente sem plug-ins adicionais.
  5. Como você lida com termos proprietários?
    Adicione dicionários personalizados nas configurações, como nomes de empresas ou termos técnicos, e o software os reconhecerá como prioridade.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Aqua Voice: entrada de voz entre aplicativos para gerar texto preciso
pt_BRPortuguês do Brasil