Introdução geral
O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar uma fala realista e semelhante à humana e transcrever áudio para texto. O Orate foi projetado para simplificar o processo de processamento de fala, permitindo que os desenvolvedores gerem e transcrevam conteúdo de fala com rapidez e precisão. Quer se trate de texto para fala (TTS) ou de fala para texto (STT), o Orate oferece uma solução eficiente e confiável.
Lista de funções
- Conversão de texto em fala (TTS)Use a IA para gerar fala realista com suporte para vários idiomas e modelos de fala.
- Conversão de fala em texto (STT)Transcrição de conteúdo de áudio complexo para texto com alta precisão e velocidade.
- Suporte a vários provedores de IAIntegração com vários dos principais provedores de IA, como OpenAI, ElevenLabs, AssemblyAI, etc., permite que os usuários escolham o melhor serviço para suas necessidades.
- API unificadaInterface de API simples: alterne e use facilmente diferentes serviços de IA por meio de uma interface de API simples.
- Instalação e uso rápidosSuporte a vários gerenciadores de pacotes, para que você possa instalá-lo e começar a usá-lo em segundos.
Usando a Ajuda
Processo de instalação
- Instalação com o npm::
npm install orate
- Instalação com fio::
fio add orate
Diretrizes para uso
Conversão de texto em fala (TTS)
- Importando a biblioteca do Orate::
importar { falar } de 'orate';
import { onzelabs } de 'orate/elevenlabs'.
- Gerar discurso::
const speech = await speak({
model: elevenlabs.tts('multilingual_v2', 'aria'),
prompt: 'Friends, Romans, countrymen, lend me your ears;'
}).
O código acima converte texto em fala, usando o modelo multilíngue da ElevenLabs.
Conversão de fala em texto (STT)
- Importando a biblioteca do Orate::
importar { transcribe } de 'orate';
import { assembly } from 'orate/assembly';
import audio from '. /audio.wav'; import { assembly } from 'orate/assembly'; import audio from '.
- transcrever áudio::
const text = await transcribe({
model: assembly.stt('best'),
audio, }); text = await transcribe({ model: assembly.
}).
O código acima transcreve o arquivo de áudio para texto, usando o melhor modelo do AssemblyAI.
Fluxo de operação detalhado da função
- Escolha de um provedor de IAEscolha o provedor de IA certo de acordo com suas necessidades, como OpenAI, ElevenLabs, AssemblyAI e assim por diante.
- Configuração da chave de APIAdicionar a chave de API do provedor de IA selecionado ao perfil da Orate
- Chamando a APIUse a interface API unificada fornecida pela Orate para chamar os serviços do provedor de IA selecionado para geração ou transcrição de fala.
- resultadoAquisição de fala gerada ou texto transcrito para processamento ou armazenamento subsequente.
A Orate fornece documentação detalhada e código de amostra para ajudar os usuários a começar rapidamente e aproveitar ao máximo seus poderosos recursos de processamento de fala.