Aqua Voice: generación de texto preciso con entrada de voz multiaplicación

Introducción general

Aqua Voice es una herramienta inteligente de generación de texto basada en el habla y centrada en convertir rápidamente el habla del usuario en texto formateado. Fundada en 2023 por Finnian Brown y Jack McIntire, y con sede en San Francisco (Estados Unidos), como parte del programa de incubación W24 de Y Combinator, Aqua Voice no solo transcribe con precisión el habla, sino que también entiende la intención del usuario en función del contexto, formatea automáticamente el texto y genera contenidos como correos electrónicos, códigos o mensajes. Es muy ágil, con un tiempo de arranque inferior a 200 milisegundos, una latencia de salida de texto tan baja como 450 milisegundos y una tasa de error unas 17 veces inferior a la de la entrada de voz de Siri y Google. Compatible con Mac y Windows, puede utilizarse en una amplia gama de aplicaciones sin necesidad de plug-ins adicionales, por lo que es ideal para los usuarios que necesitan trabajar con texto de forma eficiente.

Aqua Voice:跨应用语音输入生成精准文本

 

Lista de funciones

  • Transcripción de voz de alta precisión: Convierte la voz en texto en tiempo real, corrigiendo automáticamente la ortografía, la gramática y el formato.
  • enseñanza del lenguaje natural: Ajusta el texto con instrucciones verbales sencillas como "cambiar a lista" o "insertar tabla".
  • sensible al contexto: Complemente la información de forma inteligente u optimice la salida en función del contenido de la pantalla o del contexto del documento.
  • latencia ultrabaja: El tiempo de arranque es inferior a 200 milisegundos, con un retardo de salida en modo rápido de aproximadamente 450 milisegundos.
  • modo streaming: Admite entrada de voz continua con una latencia de aproximadamente 850 milisegundos para tareas complejas.
  • Compatibilidad entre aplicacionesIntroduce texto directamente en aplicaciones como Notion, Slack, VSCode, etc. sin necesidad de plugins.
  • Código Comprensión: Optimice la transcripción de código para desarrolladores, con soporte para resaltado de sintaxis y corrección terminológica.
  • Diccionario personalizado: Añade vocabulario propio (por ejemplo, nombres, términos técnicos) para garantizar una transcripción precisa.
  • PrivacidadLa información se procesa localmente y no se almacena ningún dato del usuario para salvaguardar la privacidad y la seguridad.

 

Utilizar la ayuda

Proceso de instalación

  1. Visite el sitio web oficial https://withaqua.com/ y haga clic en el botón "Descargar" situado en la parte superior de la página.
  2. Elige la versión en función de tu sistema operativo:
    • Los usuarios de Mac eligen la versión Apple Silicon o Intel.
    • Los usuarios de Windows descargan directamente el paquete de instalación genérico.
  3. Una vez finalizada la descarga, haz doble clic en el paquete de instalación y sigue las instrucciones para completar la instalación. El proceso completo suele durar sólo entre 3 y 5 minutos.
  4. Inicia Aqua Voice y el software detectará automáticamente el micrófono y solicitará una conexión. Si tienes algún problema, puedes consultar las FAQ del sitio web oficial para encontrar soluciones.
  5. La versión gratuita ofrece una prueba de 1.000 palabras. Después de la prueba, puede optar por suscribirse a la versión Pro (10 $ al mes o 96 $ al año).

Cómo utilizarlo

El corazón de Aqua Voice es la capacidad de generar y editar rápidamente texto por voz, que es fácil de usar y adecuado para una amplia gama de escenarios. A continuación encontrará una guía detallada para utilizarlo:

Entrada de voz básica

  1. Abra Aqua Voice y haga clic en el icono del micrófono o pulse la tecla de acceso directo predeterminada Ctrl+Space(Personalizable) Inicia la grabación.
  2. Diga algo como "Escriba un correo electrónico a Sarah explicándole que la reunión de mañana se ha cancelado". El programa genera el texto formateado:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
  1. Las pausas cortas se segmentan automáticamente y una pulsación larga en el icono del micrófono finaliza la grabación.

Utilizar instrucciones en lenguaje natural

Aqua Voice permite dar formato al texto con comandos sencillos. Por ejemplo:

  • Di "cambiar a lista" y el texto cambiará:
- 明天原定的会议已取消
- 请知悉
  • Diga "Insertar formulario" para generar:
| 任务     | 状态   |
|----------|--------|
| 会议     | 取消   |
  • Si dice "acortar este párrafo", el programa simplificará el texto, por ejemplo sustituyendo "Por favor, acuse y confirme la recepción" por "Por favor, confirme".
    Las instrucciones deben ser claras y evitar enunciados complejos. Por ejemplo, "Haga esta parte más concisa" se reconoce más fácilmente que "Optimice la estructura del texto".

Uso multiaplicación

Aqua Voice funciona en múltiples aplicaciones sin plug-ins:

  1. En Slack, Notion o Gmail, pulsa la tecla de acceso directo para activar Aqua Voice.
  2. Di algo como "Responde a Juan y dile que el proyecto está terminado". El programa lo introducirá directamente:
嗨 John,项目已经完成,请确认。
  1. Una vez hecho esto, puedes enviarlo manualmente o decir "Enviar" para activar la función de envío dentro de la aplicación (se requiere compatibilidad con la aplicación).

Función destacada Operación

  1. sensible al contexto
    Aqua Voice entiende el contexto a través del contenido en pantalla. Por ejemplo:
  • Diga "añadir comentario" al escribir código, y se generará algo como // 初始化用户数据 Las anotaciones.
  • En el correo electrónico, di "Rellena la fecha" e insertará la fecha actual, por ejemplo, "10 de abril de 2025".
  • Si se menciona el nombre de una persona (por ejemplo, "Tom"), se remitirá a la lista de contactos de la pantalla para minimizar los errores ortográficos.
  1. Comprensión del código y resaltado de sintaxis
    Para los desarrolladores, Aqua Voice reconoce los términos técnicos y optimiza el resultado:
  • Diciendo "Crear función getUserData, aceptando parámetro ID" generará:
    async function getUserData(id) {
    const response = await fetch(`/users/${id}`);
    return response.json();
    }
    
  • Corrige automáticamente la terminología, por ejemplo, cambiando "Jason" por "JSON".
  1. Modo streaming vs. modo rápido
  • modo rápido(Modo instantáneo): Adecuado para la introducción de frases cortas con un retardo de unos 450 milisegundos. El texto se emite inmediatamente después de ser pronunciado.
  • modo streaming(Modo Streaming): para párrafos largos o tareas complejas, con un retardo de unos 850 ms. Generar al dictado, adecuado para dictar documentos largos.
  • Cambiar de modo: Seleccione en los ajustes, o diga "Cambiar a modo Streaming".
  1. Diccionario personalizado
  • Añade palabras propias como "Grok" o "xAI" a tu configuración para garantizar una transcripción precisa.
  • Ejemplo: Después de añadir "Grok", decir "Grok es un asistente de inteligencia artificial" no se escribirá mal como "Grock".
  1. Privacidad y seguridad
  • Todos los datos de voz se procesan localmente y no se suben a la nube.
  • El análisis del contexto de la pantalla sólo se utiliza para optimizar la salida y no se almacena ninguna información.

advertencia

  • Asegúrate de que el micrófono es de buena calidad para evitar que el ruido de fondo interfiera en la precisión de la transcripción.
  • De momento sólo admite la voz en inglés y no en chino, pero el equipo de desarrollo ha dicho que está desarrollando funciones multilingües.
  • La conectividad a la red mejora el conocimiento del contexto, pero el modo sin conexión funciona bien para las funciones básicas.
  • Consulte regularmente la página web oficial https://withaqua.com/changelog para obtener las últimas actualizaciones y el software le pedirá automáticamente las nuevas versiones.

habilidad avanzada

  • Formateo de documentos complejos:: Diga "Formatear como informe", que genera un texto estructurado con título, cuerpo y conclusión.
  • multitareaEn modo streaming, di "Escribe un correo electrónico a Anna explicándole tus planes; luego crea una lista de tareas" y el programa lo hará por turnos.
  • Optimización de atajos: Ajuste los accesos directos en la configuración, por ejemplo, configurando la opción Ctrl+Space cambiar a Alt+Vmejorar la eficacia operativa.

Con estas funciones, los usuarios pueden utilizar fácilmente su voz para completar ediciones, desde mensajes sencillos a códigos complejos, reduciendo drásticamente el tiempo de introducción manual.

 

escenario de aplicación

  1. Comunicación eficaz en el lugar de trabajo
    Descripción del escenario: Un directivo muy ocupado necesita responder a varios correos electrónicos entre reunión y reunión. Ahorra tiempo utilizando Aqua Voice para dictar el contenido del correo electrónico y el software genera automáticamente texto formateado que se puede enviar directamente.
  2. Codificación rápida para desarrolladores
    Descripción del escenario: Los programadores dictan la lógica del código, como "Crear punto final de API REST", y Aqua Voice genera el fragmento de código exacto, reduciendo la necesidad de teclear manualmente.
  3. Notas de clase de los alumnos
    Descripción del escenario: Los estudiantes graban las clases por voz y dicen "organizar en un esquema" para generar rápidamente materiales de repaso para organizarlos fácilmente después de clase.
  4. Ayudas a la accesibilidad
    Descripción del escenario: Los usuarios que no saben mecanografiar manejan cómodamente sus ordenadores mediante la voz para completar el envío de mensajes o la edición de documentos, con el fin de mejorar su vida y la eficiencia de su trabajo.

 

CONTROL DE CALIDAD

  1. ¿Aqua Voice admite voz en chino?
    Actualmente sólo es compatible con el inglés, la función en chino está en desarrollo. Puede seguir el sitio web oficial https://withaqua.com/blog para actualizaciones.
  2. ¿Cuáles son las limitaciones de la versión gratuita?
    La versión gratuita ofrece una prueba de 1000 palabras y 5 ranuras de diccionario personalizadas. Las palabras ilimitadas requieren una suscripción Pro (10 $ al mes).
  3. ¿Cómo se garantiza la seguridad de los datos?
    Los datos de voz y pantalla se procesan localmente, no se suben a la nube, y no se almacena ninguna información sin el permiso del usuario.
  4. ¿En qué aplicaciones puede utilizarse?
    Aqua Voice es compatible con Notion, Slack, VSCode, Gmail, WhatsApp, etc. Introduce texto directamente sin plug-ins adicionales.
  5. ¿Cómo se gestionan las cláusulas de propiedad?
    Añade diccionarios personalizados en los ajustes, como nombres de empresas o términos técnicos, y el software los reconocerá prioritariamente.
© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...