Allgemeine Einführung
Deepgram ist ein Unternehmen, das sich auf Technologien zur Spracherkennung und Verarbeitung natürlicher Sprache spezialisiert hat und leistungsstarke Speech-to-Text- und Text-to-Speech-APIs anbietet. Die Plattform nutzt fortschrittliche KI-Technologien, um Entwickler bei der Integration von Sprachtranskriptions- und -verstehensfunktionen in ihre Anwendungen und Dienste zu unterstützen. Die Lösungen von Deepgram werden in einer Vielzahl von Bereichen eingesetzt, z. B. in der medizinischen Transkription, im automatisierten Kundenservice, bei der Transkription von Podcasts usw., und sind darauf ausgerichtet, die Effizienz und das Erlebnis der Interaktion zwischen Mensch und Computer zu verbessern.
Funktionsliste
- Sprache-zu-Text (STT)Bietet hochpräzise, latenzarme Sprache-zu-Text-Dienste, die mehrere Sprachen und Akzente unterstützen.
- Text-to-Speech (TTS)Generieren Sie natürliche und flüssige Sprachausgabe für Echtzeit-KI und Anwendungen mit hohem Durchsatz.
- Audio-Intelligenz (AI)Audioanalyse und -verstehen: Bietet Audioanalyse- und -verstehensfunktionen zur Unterstützung von Unternehmen bei der Analyse umfangreicher Audiodaten.
- Sprachagenten-API (Sprachagenten-API)Unified Speech API: Unified Speech API unterstützt den natürlichen Dialog zwischen Mensch und Computer für eine Vielzahl von Automatisierungsanwendungen.
Hilfe verwenden
Installation und Nutzung
- ein Konto registrieren: Besuchen Sie die offizielle Deepgram-Website und registrieren Sie ein neues Konto.
- API-Schlüssel abrufenNachdem Sie sich in Ihrem Konto angemeldet haben, rufen Sie den API-Schlüssel in der Konsole ab.
- Integrierte API::
- Sprache zu Text (STT)::
Python
importieren Anfragen url = "https://api.deepgram.com/v1/listen" headers = { "Autorisierung": "Token IHR_API_KEY", "Inhalts-Typ": "application/json" } data = { "url": "https://path.to/your/audio/file.wav" } response = requests.post(url, headers=headers, json=data) drucken(response.json())
- Text-to-Speech (TTS)::
Python
importieren Anfragen url = "https://api.deepgram.com/v1/speak" headers = { "Autorisierung": "Token YOUR_API_KEY", "Inhalts-Typ": "application/json" } data = { "Text": "Hallo, dies ist ein Test.", "Stimme": "en_us_male" } response = requests.post(url, headers=headers, json=data) mit öffnen("output.wav", "wb") als f. f.write(response.content)
- Sprache zu Text (STT)::
- Echtzeit-SprachverarbeitungEchtzeit-Spracherkennung mit WebSocket-Verbindungen.
Python
importieren Websocket importieren json def on_message(ws, Nachricht): drucken(json.loads(message)) ws = websocket.WebSocketApp( "wss://api.deepgram.com/v1/listen", header={"Autorisierung": "Token YOUR_API_KEY"}, on_message=on_message ) ws.run_forever()
Speech-to-Text Benutzerhandbuch
- Integrierte APIIntegrieren Sie die Speech-to-Text-API von Deepgram in Ihre Anwendung. Für die Integration können Sie den Beispielcode in der offiziellen Dokumentation verwenden.
- Hochladen von AudiodateienHochladen von zu transkribierenden Audiodateien über API, Unterstützung mehrerer Audioformate.
- Transkriptionsergebnisse abrufenDie API liefert transkribierte Textergebnisse, die Sie in Ihrer Anwendung weiterverarbeiten und anzeigen können.
Text-to-Speech Benutzerhandbuch
- Integrierte API: Integrieren Sie die Text-to-Speech-API von Deepgram in Ihre Anwendung.
- EingabetextEingabe von Textinhalten, die über die API in Sprache umgewandelt werden sollen.
- Sprachausgabe erhaltenDie API gibt die generierte Sprachdatei zurück, die Sie abspielen oder in Ihrer Anwendung speichern können.
Audio Intelligence Benutzerhandbuch
- Integrierte APIIntegrieren Sie die Audio Intelligence API von Deepgram in Ihre Anwendung.
- Hochladen von AudiodateienHochladen von Audiodateien, die über die API analysiert werden sollen.
- Abrufen von AnalyseergebnissenDie API liefert Ergebnisse der Audioanalyse, einschließlich Stimmungsanalyse, Schlagwortextraktion und anderer Informationen.
Voice Agent API (Sprachagenten-API) Benutzerhandbuch
- Integrierte API: Integrieren Sie Deepgrams Voice Agent API in Ihre Anwendung.
- Konfigurieren des DialogmodellsKonfiguration des Dialogmodells: Konfigurieren Sie das passende Dialogmodell je nach Anwendungsszenario.
- Ermöglichung des Dialogs zwischen Mensch und MaschineErmöglichung eines natürlichen und reibungslosen Dialogs zwischen Mensch und Maschine durch APIs zur Verbesserung der Benutzerfreundlichkeit.
Melden Sie sich an und erhalten Sie ein 200-Messer-Guthaben, um die gesamte Palette der APIs aufzurufen.