Orate: 잘 알려진 음성 생성, 음성 전사 및 음성 모델링을 통합하기 위한 통합 API

55.8K 00

일반 소개

Orate는 음성 생성 및 트랜스크립션에 중점을 둔 AI 툴킷입니다. 사용자가 사실적이고 인간과 같은 음성을 생성하고 오디오를 텍스트로 변환할 수 있도록 OpenAI, ElevenLabs, AssemblyAI와 같은 주요 AI 제공업체와 원활하게 통합되는 통합 API를 제공하며, 개발자가 음성 처리 프로세스를 간소화하여 음성 콘텐츠를 빠르고 정확하게 생성 및 변환할 수 있도록 설계되었습니다. 텍스트 음성 변환(TTS)이든 음성 텍스트 변환(STT)이든 Orate는 효율적이고 신뢰할 수 있는 솔루션을 제공합니다.

기능 목록

텍스트 음성 변환(TTS)여러 언어와 음성 모델을 지원하는 AI를 사용하여 사실적인 음성을 생성하세요.
음성 텍스트 변환(STT)복잡한 오디오 콘텐츠를 높은 정확도와 속도로 텍스트로 변환합니다.
멀티 AI 제공업체 지원OpenAI, ElevenLabs, AssemblyAI 등 여러 주요 AI 제공업체와의 통합을 통해 사용자는 자신의 필요에 맞는 최적의 서비스를 선택할 수 있습니다.
통합 API간단한 API 인터페이스를 통해 다양한 AI 서비스를 쉽게 전환하고 사용할 수 있습니다.
빠른 설치 및 사용여러 패키지 관리자가 지원되므로 몇 초 만에 설치하여 사용할 수 있습니다.

도움말 사용

설치 프로세스

npm으로 설치::

   npm install orate

원사를 사용한 설치::

   yarn add orate

사용 가이드라인

텍스트 음성 변환(TTS)

Orate 라이브러리 가져오기::

   import { speak } from 'orate';
import { elevenlabs } from 'orate/elevenlabs';

음성 생성::

   const speech = await speak({
model: elevenlabs.tts('multilingual_v2', 'aria'),
prompt: 'Friends, Romans, countrymen, lend me your ears;'
});

위의 코드는 ElevenLabs의 다국어 모델을 사용하여 텍스트를 음성으로 변환합니다.

음성 텍스트 변환(STT)

Orate 라이브러리 가져오기::

   import { transcribe } from 'orate';
import { assembly } from 'orate/assembly';
import audio from './audio.wav';

오디오 전사::

   const text = await transcribe({
model: assembly.stt('best'),
audio,
});

위의 코드는 AssemblyAI의 베스트 모델을 사용하여 오디오 파일을 텍스트로 변환합니다.

세부 기능 작동 흐름

AI 제공업체 선택하기OpenAI, ElevenLabs, AssemblyAI 등 필요에 따라 적합한 AI 제공업체를 선택하세요.
API 키 구성선택한 AI 제공업체의 API 키를 Orate 프로필에 추가합니다.
API 호출하기Orate에서 제공하는 통합 API 인터페이스를 사용하여 음성 생성 또는 전사를 위해 선택한 AI 제공업체의 서비스를 호출합니다.
결과후속 처리 또는 저장을 위해 생성된 음성 또는 전사된 텍스트를 수집합니다.

Orate는 사용자가 빠르게 시작하고 강력한 음성 처리 기능을 최대한 활용할 수 있도록 자세한 문서와 샘플 코드를 제공합니다.