AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel

Aqua Voice: Akkurate Texterzeugung mit anwendungsübergreifender Spracheingabe

Allgemeine Einführung

Aqua Voice ist ein intelligentes sprachbasiertes Texterstellungswerkzeug, das sich auf die schnelle Umwandlung von Benutzersprache in formatierten Text konzentriert. Aqua Voice wurde 2023 von Finnian Brown und Jack McIntire gegründet und hat seinen Hauptsitz in San Francisco, USA, als Teil des Y Combinator W24 Inkubationsprogramms. Aqua Voice transkribiert nicht nur Sprache genau, sondern versteht auch die Absicht des Nutzers anhand des Kontexts und formatiert den Text automatisch, um Inhalte wie E-Mails, Codes oder Nachrichten zu generieren. Es ist reaktionsschnell, mit einer Startzeit von weniger als 200 Millisekunden, einer Latenzzeit bei der Textausgabe von nur 450 Millisekunden und einer Fehlerquote, die etwa 17 Mal niedriger ist als bei der Spracheingabe über Siri und Google. Dank der Unterstützung für Mac und Windows kann es in einer Vielzahl von Anwendungen ohne zusätzliche Plug-ins verwendet werden, was es ideal für Benutzer macht, die ihre Textarbeit effizient erledigen müssen.

Aqua Voice: Anwendungsübergreifende Spracheingabe zur Generierung von präzisem Text-1


 

Funktionsliste

  • Hochpräzise SprachtranskriptionWandelt Sprache in Echtzeit in Text um und korrigiert dabei automatisch Rechtschreibung, Grammatik und Formatierung.
  • Unterricht in natürlicher SpracheAnpassung des Textes durch einfache verbale Anweisungen wie "zur Liste wechseln" oder "Tabelle einfügen".
  • kontextabhängigIntelligente Ergänzung von Informationen oder Optimierung der Ausgabe auf der Grundlage des Bildschirminhalts oder des Dokumentkontexts.
  • ultraniedrige LatenzzeitEinschaltzeit: Die Einschaltzeit beträgt weniger als 200 Millisekunden, mit einer Ausgangsverzögerung im Schnellmodus von etwa 450 Millisekunden.
  • Streaming-ModusUnterstützt kontinuierliche Spracheingabe mit einer Latenzzeit von etwa 850 Millisekunden für komplexe Aufgaben.
  • Anwendungsübergreifende KompatibilitätText direkt in Anwendungen wie Notion, Slack, VSCode und andere eingeben, ohne ein Plugin zu benötigen.
  • Code-VerständnisOptimieren Sie die codebezogene Transkription für Entwickler mit Unterstützung für Syntaxhervorhebung und Terminologiekorrektur.
  • Benutzerdefiniertes WörterbuchHinzufügen von eigenem Vokabular (z. B. Namen, Fachbegriffe), um eine genaue Transkription zu gewährleisten.
  • DatenschutzDaten werden lokal verarbeitet und es werden keine Nutzerdaten gespeichert, um die Privatsphäre und die Sicherheit zu gewährleisten.

 

Hilfe verwenden

Einbauverfahren

  1. Besuchen Sie die offizielle Website https://withaqua.com/ und klicken Sie auf die Schaltfläche "Download" oben auf der Seite.
  2. Wählen Sie die Version, die Ihrem Betriebssystem entspricht:
    • Mac-Benutzer wählen die Apple Silicon oder Intel-Version.
    • Windows-Benutzer laden das allgemeine Installationspaket direkt herunter.
  3. Sobald der Download abgeschlossen ist, doppelklicken Sie auf das Installationspaket und folgen Sie den Aufforderungen, um die Installation abzuschließen. Der gesamte Vorgang dauert in der Regel nur 3-5 Minuten.
  4. Starten Sie Aqua Voice und die Software wird das Mikrofon automatisch erkennen und nach einer Verbindung fragen. Wenn Sie Probleme haben, können Sie in den FAQ auf der offiziellen Website nach Lösungen suchen.
  5. Wenn Sie zum ersten Mal ein Konto eröffnen, müssen Sie sich anmelden. Die kostenlose Version bietet eine Testversion mit 1.000 Wörtern. Nach der Testphase können Sie sich für ein Abonnement der Pro-Version entscheiden (10 $ pro Monat oder 96 $ pro Jahr).

Wie zu verwenden

Das Herzstück von Aqua Voice ist die Möglichkeit, schnell und einfach Text per Sprache zu erstellen und zu bearbeiten. Diese Funktion ist einfach zu bedienen und eignet sich für eine Vielzahl von Szenarien. Im Folgenden finden Sie eine ausführliche Anleitung für die Verwendung des Programms:

Einfache Spracheingabe

  1. Öffnen Sie Aqua Voice und klicken Sie auf das Mikrofonsymbol oder drücken Sie die Standardtaste Ctrl+Space(anpassbar) Startet die Aufnahme.
  2. Sagen Sie etwas wie "Schreiben Sie eine E-Mail an Sarah, in der Sie erklären, dass die morgige Besprechung abgesagt ist". Die Software generiert den formatierten Text:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
  1. Kurze Pausen werden automatisch unterteilt, und ein langer Druck auf das Mikrofonsymbol beendet die Aufnahme.

Verwendung von Anweisungen in natürlicher Sprache

Aqua Voice unterstützt die Textformatierung mit einfachen Befehlen. Zum Beispiel:

  • Sagen Sie "zur Liste wechseln" und der Text wird geändert:
- 明天原定的会议已取消
- 请知悉
  • Sagen Sie "Formular einfügen", um es zu erstellen:
| 任务     | 状态   |
|----------|--------|
| 会议     | 取消   |
  • Wenn Sie sagen, dass dieser Absatz gekürzt werden soll, strafft die Software den Text, indem sie zum Beispiel "Bitte bestätigen Sie den Empfang" durch "Bitte bestätigen Sie" ersetzt.
    Anweisungen sollten klar sein und komplexe Aussagen vermeiden. Ein Beispiel: "Fassen Sie diesen Teil besser zusammen" ist leichter zu erkennen als "Optimieren Sie die Struktur des Textes".

Anwendungsübergreifender Einsatz

Aqua Voice funktioniert in mehreren Anwendungen ohne Plug-ins:

  1. Drücken Sie in Slack, Notion oder Gmail die Schnelltaste, um Aqua Voice zu aktivieren.
  2. Sagen Sie etwas wie "Antworten Sie John und teilen Sie ihm mit, dass das Projekt abgeschlossen ist". Die Software wird es direkt eingeben:
嗨 John,项目已经完成,请确认。
  1. Anschließend können Sie die Nachricht manuell versenden oder mit "Senden" die In-App-Sendefunktion auslösen (App-Unterstützung erforderlich).

Featured Function Bedienung

  1. kontextabhängig
    Aqua Voice versteht den Kontext durch Bildschirminhalte. Zum Beispiel:
  • Sagen Sie beim Schreiben von Code "Kommentar hinzufügen", und es wird etwas erzeugt wie // 初始化用户数据 Die Anmerkungen.
  • Sagen Sie in der E-Mail "Fill in the date" und es wird das aktuelle Datum eingefügt, z. B. "10 April 2025".
  • Wenn der Name einer Person erwähnt wird (z. B. "Tom"), wird auf die Liste der Kontakte auf dem Bildschirm verwiesen, um Rechtschreibfehler zu vermeiden.
  1. Code-Verständnis und Syntax-Hervorhebung
    Für Entwickler erkennt Aqua Voice Fachbegriffe und optimiert die Ausgabe:
  • Wenn Sie sagen: "Erstellen Sie die Funktion getUserData, die einen ID-Parameter akzeptiert", wird eine Funktion erzeugt:
    async function getUserData(id) {
    const response = await fetch(`/users/${id}`);
    return response.json();
    }
    
  • Korrigiert automatisch die Terminologie, indem es z. B. "Jason" in "JSON" ändert.
  1. Streaming-Modus vs. schneller Modus
  • Schnellmodus(Sofortmodus): Geeignet für die Eingabe kurzer Sätze mit einer Verzögerung von etwa 450 Millisekunden. Der Text wird sofort nach dem Sprechen ausgegeben.
  • Streaming-Modus(Streaming-Modus): für lange Absätze oder komplexe Aufgaben, mit einer Verzögerung von etwa 850 ms. Generate-as-you-speak, geeignet für das Diktieren langer Dokumente.
  • Modus wechseln: Wählen Sie in den Einstellungen oder sagen Sie "Zum Streaming-Modus wechseln".
  1. Benutzerdefiniertes Wörterbuch
  • Fügen Sie Ihren Einstellungen proprietäre Wörter wie "Grok" oder "xAI" hinzu, um eine genaue Transkription zu gewährleisten.
  • Beispiel: Wenn Sie nach dem Hinzufügen von "Grok" sagen: "Grok ist ein KI-Assistent", wird es nicht als "Grock" falsch geschrieben.
  1. Datenschutz und Sicherheit
  • Alle Sprachdaten werden lokal verarbeitet und nicht in die Cloud hochgeladen.
  • Die Analyse des Bildschirmkontexts wird nur zur Optimierung der Ausgabe verwendet, und es werden keine Informationen gespeichert.

caveat

  • Stellen Sie sicher, dass das Mikrofon von guter Qualität ist, um zu vermeiden, dass Hintergrundgeräusche die Genauigkeit der Transkription beeinträchtigen.
  • Derzeit wird nur Englisch unterstützt, die chinesische Spracheingabe wird vorerst nicht unterstützt, aber das Entwicklungsteam sagte, dass es mehrsprachige Funktionen entwickelt.
  • Die Netzwerkverbindung verbessert die Kontexterkennung, aber der Offline-Modus eignet sich gut für grundlegende Funktionen.
  • Schauen Sie regelmäßig auf der offiziellen Website https://withaqua.com/changelog nach den neuesten Updates, und die Software fragt automatisch nach neuen Versionen.

fortgeschrittene Fähigkeit

  • Komplexe Dokumentformatierung:: Sagen Sie "Als Bericht formatieren", was einen strukturierten Text mit einem Titel, einem Hauptteil und einer Schlussfolgerung erzeugt.
  • Multitasking: Sagen Sie im Streaming-Modus: "Schreiben Sie eine E-Mail an Anna, in der Sie Ihre Pläne erläutern; erstellen Sie dann eine Aufgabenliste", und die Software wird dies der Reihe nach tun.
  • Optimierung der Abkürzungen: Passen Sie die Tastenkombinationen in den Einstellungen an, indem Sie z. B. die Option Ctrl+Space umwandeln in Alt+Vdie betriebliche Effizienz zu verbessern.

Mit diesen Funktionen können die Benutzer einfache Nachrichten bis hin zu komplexem Code mit ihrer Stimme bearbeiten und so die manuelle Eingabezeit drastisch reduzieren.

 

Anwendungsszenario

  1. Effektive Kommunikation am Arbeitsplatz
    Beschreibung des Szenarios: Ein vielbeschäftigter Manager muss zwischen zwei Meetings mehrere E-Mails beantworten. Sparen Sie Zeit, indem Sie Aqua Voice verwenden, um E-Mail-Inhalte zu diktieren. Die Software generiert automatisch formatierten Text, der direkt gesendet werden kann.
  2. Schnelle Kodierung für Entwickler
    Szenariobeschreibung: Programmierer diktieren die Codelogik, wie z. B. "REST-API-Endpunkt erstellen", und Aqua Voice generiert den exakten Codeschnipsel, wodurch die Notwendigkeit der manuellen Tastatureingabe reduziert wird.
  3. Notizen der Schüler im Klassenzimmer
    Beschreibung des Szenarios: Studierende nehmen Vorlesungen per Sprache auf und sagen "Gliederung erstellen", um schnell Wiederholungsmaterialien zu erstellen, die sich nach dem Unterricht leicht organisieren lassen.
  4. Zugänglichkeitshilfen
    Beschreibung des Szenarios: Benutzer, die nicht tippen können, bedienen ihren Computer bequem per Sprache, um Nachrichten zu versenden oder Dokumente zu bearbeiten, um ihr Leben und ihre Arbeitseffizienz zu verbessern.

 

QA

  1. Unterstützt Aqua Voice chinesische Sprache?
    Derzeit wird nur Englisch unterstützt, die chinesische Funktion ist in der Entwicklung. Sie können die offizielle Website https://withaqua.com/blog für Updates verfolgen.
  2. Was sind die Einschränkungen der kostenlosen Version?
    Die kostenlose Version bietet eine Testversion mit 1000 Wörtern und 5 benutzerdefinierte Wörterbuchplätze. Unbegrenzte Wörter erfordern ein Pro-Abonnement ($10 pro Monat).
  3. Wie gewährleisten Sie die Datensicherheit?
    Sprach- und Bildschirmdaten werden lokal verarbeitet und nicht in die Cloud hochgeladen, und keine Informationen werden ohne die Zustimmung des Benutzers gespeichert.
  4. Für welche Anwendungen kann es eingesetzt werden?
    Aqua Voice unterstützt Notion, Slack, VSCode, Gmail, WhatsApp usw. Geben Sie Text direkt ohne zusätzliche Plug-ins ein.
  5. Wie gehen Sie mit geschützten Begriffen um?
    Fügen Sie in den Einstellungen benutzerdefinierte Wörterbücher hinzu, wie z. B. Firmennamen oder Fachbegriffe, und die Software erkennt diese als Priorität.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Aqua Voice: Akkurate Texterzeugung mit anwendungsübergreifender Spracheingabe
de_DEDeutsch