일반 소개
딥그램은 음성 인식 및 자연어 처리 기술을 전문으로 하는 회사로 강력한 음성 텍스트 변환 및 텍스트 음성 변환 API를 제공하며, 이 플랫폼은 개발자가 음성 전사 및 이해 기능을 애플리케이션과 서비스에 통합할 수 있도록 지원하는 고급 AI 기술을 활용합니다. 딥그램의 솔루션은 의료 트랜스크립션, 자동화된 고객 서비스, 팟캐스트 트랜스크립션 등 다양한 분야에서 널리 사용되고 있으며 인간과 컴퓨터 간의 상호작용의 효율성과 경험을 개선하는 데 전념하고 있습니다.

기능 목록
- 음성-텍스트 변환(STT)여러 언어와 억양을 지원하는 고정밀, 저지연 음성-텍스트 변환 서비스를 제공합니다.
- 텍스트 음성 변환(TTS)실시간 AI 및 고처리량 애플리케이션을 위한 자연스럽고 부드러운 음성 출력을 생성합니다.
- 오디오 인텔리전스(AI)조직이 대규모 오디오 데이터 분석을 수행할 수 있도록 오디오 분석 및 이해 기능을 제공합니다.
- 음성 에이전트 API(음성 에이전트 API)다양한 자동화 애플리케이션 시나리오에서 인간과 기계의 자연스러운 대화를 지원하는 통합 음성 API입니다.
도움말 사용
설치 및 사용
- 계정 등록하기딥그램 공식 웹사이트를 방문하여 새 계정을 등록하세요.
- API 키 가져오기계정에 로그인한 후 콘솔에서 API 키를 받습니다.
- 통합 API::
- 음성 텍스트 변환(STT)::
Python
import requests url = "https://api.deepgram.com/v1/listen" headers = { "Authorization": "Token YOUR_API_KEY", "Content-Type": "application/json" } data = { "url": "https://path.to/your/audio/file.wav" } response = requests.post(url, headers=headers, json=data) print(response.json())
- 텍스트 음성 변환(TTS)::
Python
import requests url = "https://api.deepgram.com/v1/speak" headers = { "Authorization": "Token YOUR_API_KEY", "Content-Type": "application/json" } data = { "text": "Hello, this is a test.", "voice": "en_us_male" } response = requests.post(url, headers=headers, json=data) with open("output.wav", "wb") as f: f.write(response.content)
- 음성 텍스트 변환(STT)::
- 실시간 음성 처리웹소켓 연결을 사용한 실시간 음성 인식.
Python
import websocket import json def on_message(ws, message): print(json.loads(message)) ws = websocket.WebSocketApp( "wss://api.deepgram.com/v1/listen", header={"Authorization": "Token YOUR_API_KEY"}, on_message=on_message ) ws.run_forever()
음성-텍스트 변환 사용자 가이드
- 통합 API딥그램의 음성 텍스트 변환 API를 애플리케이션에 통합하세요. 통합은 공식 문서에서 샘플 코드를 참조하세요.
- 오디오 파일 업로드API를 통해 전사할 오디오 파일을 업로드하고, 여러 오디오 형식을 지원합니다.
- 전사 결과 보기API는 애플리케이션에서 추가 처리 및 표시할 수 있는 전사된 텍스트 결과를 반환합니다.
텍스트 음성 변환 사용 가이드
- 통합 API딥그램의 텍스트 음성 변환 API를 애플리케이션에 통합하세요.
- 입력 텍스트API를 통해 음성으로 변환할 텍스트 콘텐츠를 입력합니다.
- 음성 출력 얻기API는 생성된 음성 파일을 반환하며, 이를 애플리케이션에서 재생하거나 저장할 수 있습니다.
오디오 인텔리전스 사용 가이드
- 통합 API딥그램의 오디오 인텔리전스 API를 애플리케이션에 통합하세요.
- 오디오 파일 업로드API를 통해 분석할 오디오 파일을 업로드합니다.
- 분석 결과 얻기API는 감정 분석, 키워드 추출 및 기타 정보를 포함한 오디오 분석 결과를 반환합니다.
음성 에이전트 API(보이스 에이전트 API) 사용 가이드
- 통합 API딥그램의 음성 에이전트 API를 애플리케이션에 통합하세요.
- 대화 모델 구성하기: 애플리케이션 시나리오에 따라 적절한 대화 모델을 구성합니다.
- 인간과 기계의 대화 활성화API를 통해 자연스럽고 원활한 인간과 기계의 대화를 지원하여 사용자 경험을 개선합니다.
가입하고 모든 API를 호출할 수 있는 200 칼 크레딧을 받으세요.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...