Introdução geral
A ElevenLabs é uma startup sediada em Nova York, EUA, especializada no campo da fala geradora de IA. A empresa oferece uma gama de serviços avançados de conversão de texto em fala, conversão de fala em fala, clonagem de fala e reconhecimento de fala. A força da ElevenLabs está em seu forte suporte multilíngue e em seus recursos de personalização, com suporte a 32 idiomas, incluindo chinês, inglês, japonês e coreano. A plataforma é amplamente utilizada na produção de audiolivros, dublagem de filmes, vozes de NPCs de jogos e outras áreas de produção de conteúdo.
Lista de funções
- Conversão de texto em falaConversão de texto em fala de alta qualidade e com som natural.
- clonagem de falaCrie clones de voz personalizados com alguns minutos de áudio.
- Suporte a vários idiomasSuporte à geração e conversão de fala em 32 idiomas.
- biblioteca fonéticaFornece uma biblioteca de voz rica para os usuários escolherem e usarem.
- Integração de APIAPIs de baixa latência para facilitar a integração dos desenvolvedores aos aplicativos.
- gerenciamento de projetosSuporte para recursos de gerenciamento de projetos, como conversão de livros em audiolivros, scripts em podcasts e muito mais.
Usando a Ajuda
Instalação e registro
- Visite o site da ElevenLabs (onzelabs.io).
- Clique no botão "Register" (Registrar) e preencha as informações relevantes para concluir o registro.
- Depois de fazer login, vá para o Painel de controle do usuário e selecione o serviço desejado.
Guia de operação de funções
Conversão de texto em fala
- Selecione a função "Text to Speech" (Texto para fala) no painel de controle.
- Digite ou cole o conteúdo do texto a ser convertido.
- Selecione o tipo de voz e o idioma desejados.
- Clique no botão "Generate" (Gerar) e aguarde até que o sistema gere o arquivo de voz.
- Baixe os arquivos de voz gerados ou reproduza-os diretamente na plataforma.
clonagem de fala
- Selecione a função "Voice Clone" no painel de controle.
- Carregue alguns minutos de amostras de áudio e o sistema analisará e gerará automaticamente um modelo de clonagem de fala.
- Selecione o modelo de clone de fala gerado e insira o conteúdo do texto para geração de fala.
- Faça o download ou reproduza o arquivo de voz gerado.
Suporte a vários idiomas
- Em qualquer função de geração de fala, selecione o idioma desejado.
- Insira conteúdo de texto e o sistema reconhecerá e gerará automaticamente arquivos de fala no idioma correspondente.
Integração de API
- Selecione a função "API Integration" no painel de controle.
- Obtenha a chave da API e a documentação relacionada.
- Siga as instruções da documentação para integrar a API em seu aplicativo para obter a funcionalidade de geração de fala.
gerenciamento de projetos
- Selecione a função "Project Management" no painel de controle.
- Crie um novo projeto e selecione o tipo de projeto (por exemplo, audiolivro, podcast, etc.).
- Faça upload de conteúdo de texto ou áudio relevante e o sistema processará e gerará automaticamente os arquivos de voz necessários.
- Faça download ou reproduza o arquivo de projeto gerado.
Programa de associação da ElevenLabs
Esquema de associação | preços | Limite mensal de caracteres | Sons personalizados | Caracteres adicionais baseados no uso | Conversão de texto em fala e fala em fala | Acesso a uma biblioteca crescente de sons | dublagem automática | estúdio de dublagem | qualidade de áudio | Formato da API | Design de som sintético | Clonagem instantânea de sons | Clonagem de som profissional | evento esportivo | Análise de uso | licença comercial | Não há necessidade de atribuição |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
freeware | $0/permanente | 10.000 (~10 minutos de áudio) | 3 vozes | - | ✔️ | ✔️ | - | - | 128 kbps, 44,1 kHz | PCM de 16kHz, uLaw | - | - | - | - | - | - | ✔️ |
introdução (um assunto) | $5 $1/mês (20% de desconto no primeiro mês) | 30.000 (~30 minutos de áudio) | 10 vozes | $0.30/1000 caracteres | ✔️ | ✔️ | - | - | 128 kbps, 44,1 kHz | 22,05kHz PCM, uLaw | - | - | - | - | - | - | ✔️ |
autor (de algum projeto) | $22 $11/mês (50% de desconto no primeiro mês) | 100.000 (~2 horas de áudio) | 30 vozes | $0.24/1000 caracteres | ✔️ | ✔️ | ✔️ | - | 128 e 192 kbps (via projeto), 44,1 kHz | 24kHz PCM, uLaw | ✔️ | ✔️ | - | ✔️ | ✔️ | ✔️ | ✔️ |
profissões | $99/mês | 500.000 (~10 horas de áudio) | 160 vozes | $0.18/1000 caracteres | ✔️ | ✔️ | ✔️ | ✔️ | 128 e 192 kbps (via projeto e API), 44,1 kHz | 44,1 kHz PCM, uLaw | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
estádio | $330/mês | 2.000.000 (~40 horas de áudio) | 660 vozes | - | ✔️ | ✔️ | ✔️ | ✔️ | 128 e 192 kbps (via projeto), 44,1 kHz | 44,1 kHz PCM, uLaw | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |