Clonagem de voz com IA

Total de 41 artigos
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: um modelo leve para sintetizar a fala em chinês e inglês

Introdução abrangente O MegaTTS3 é uma ferramenta de síntese de fala de código aberto desenvolvida pela ByteDance em cooperação com a Universidade de Zhejiang, com foco na geração de fala em chinês e inglês de alta qualidade. Seu modelo principal tem apenas 0,45B de parâmetros, é leve e eficiente, suporta a geração de discursos mistos em chinês e inglês e a clonagem de discursos. O projeto está hospedado em ...
4 meses atrás
01.3K
PlayHT:生成超真实语音的AI工具

PlayHT: uma ferramenta de IA para gerar fala hiper-realista

Introdução geral A PlayHT é uma plataforma on-line eficiente que se concentra na geração de fala com IA para ajudar os usuários a converter rapidamente texto em fala natural e realista. Ela oferece mais de 600 vozes de IA que suportam mais de 60 idiomas e diversos sotaques para a produção de podcasts, conteúdo educacional, promoção de marketing...
5 meses atrás
01.2K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: uma estrutura de interação de voz multimodal que reconhece a fala e se comunica usando a fala clonada, entre outros recursos

Introdução abrangente O Step-Audio é uma estrutura de interação de fala inteligente de código aberto projetada para fornecer recursos de geração e compreensão de fala prontos para uso em ambientes de produção. A estrutura oferece suporte a conversas em vários idiomas (por exemplo, chinês, inglês, japonês), discurso emocional (por exemplo, feliz, triste), dialetos regionais (por exemplo, cantonês, sichuanês ...
6 meses atrás
02K
Weights:模仿声音翻唱歌曲和文本转语音的创作平台

Weights: uma plataforma de autoria de música cover de imitação de voz e texto para fala

Introdução geral O Weights é uma plataforma social para criatividade usando IA que permite aos usuários criar capas de voz, conversão de texto em fala, imagens, músicas e vídeos com ações simples. A plataforma oferece uma grande variedade de ferramentas e modelos para ajudar os usuários a começar a criar rapidamente e compartilhar com a comunidade desde...
6 meses atrás
02.3K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: clonagem de voz on-line gratuita em apenas 3 segundos!

Introdução geral O AnyVoice é uma plataforma avançada de geração de fala com IA que oferece serviços de geração de fala e clonagem de voz ultrarrealistas. A plataforma permite que os usuários convertam texto em fala natural e escolham entre centenas de vozes predefinidas. Se você não conseguir encontrar a voz certa, basta...
6 meses atrás
02K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade

Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo se baseia na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para oferecer geração de fala de alta qualidade que não só oferece suporte a várias...
6 meses atrás
01.8K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: assistente de clonagem de voz de IA de ponta a ponta, assistente de diálogo de voz em tempo real, projeto derivado do Fish Speech

Introdução abrangente Fish Speech Derivative Project O Fish Agent é um sistema revolucionário de clonagem de fala de IA de ponta a ponta desenvolvido com base na arquitetura do modelo V0.1 3B. Como um sistema de processamento de clonagem de fala de ponta a ponta, seu recurso mais importante é o uso de...
7 meses atrás
02.1K
ViiTor AI:音频/视频多语言翻译合成与语音克隆服务

ViiTor AI: serviço de tradução multilíngue de áudio/vídeo, síntese e clonagem de fala

Introdução abrangente A ViiTor AI é uma poderosa plataforma de inteligência artificial focada em fornecer serviços de tradução de vídeo de alta qualidade, clonagem de voz, vídeos de avatar gerados por IA e síntese de fala. A plataforma é compatível com vários idiomas e tem como objetivo ajudar os usuários a criar conteúdo multilíngue com facilidade.ViiTo...
8 meses atrás
02.7K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: modelo de clonagem de texto para fala com amostragem zero (pacote de implantação local com um clique)

Introdução abrangente O MaskGCT (Masked Generative Codec Transformer) é um modelo de conversão de texto em fala (TTS) totalmente não autorregressivo introduzido em conjunto pela Funky Maru Technology e pela Universidade Chinesa de Hong Kong. O modelo não requer conversão explícita de texto em fala ...
9 meses atrás
02.5K
趣丸千音:语音克隆并结合口型同步,一键翻译视频为多语言!

Funky Maru Chiyo: clonagem de voz e combinação com sincronização de boca para traduzir vídeos em vários idiomas com um único clique!

Introdução abrangente O Funmaru Thousand Voices é uma plataforma de síntese de voz de IA multilíngue que oferece soluções de geração de voz realistas e naturais. Os usuários podem converter facilmente conteúdo de texto em áudio de nível profissional e apoiar a criação de vozes de IA exclusivas (clones de voz) a partir de zero amostras para atender a necessidades personalizadas. A plataforma também oferece recursos de tradução de vídeo para ajudar...
8 meses atrás
01.9K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: projeto de código aberto de clonagem de voz de 3 segundos lançado por Ali com suporte para tags controladas emocionalmente

Introdução abrangente O CosyVoice é um modelo multilíngue de geração de fala em larga escala que oferece recursos de pilha completa, desde a inferência, o treinamento até a implantação. Desenvolvido pela equipe do FunAudioLLM, ele tem como objetivo obter uma fala de alta qualidade por meio de transformadores autorregressivos avançados e modelos de difusão baseados em ODE...
6 meses atrás
03.5K
海螺AI视频生成器:文本或图像生成高质量视频,影视级镜头创作

Gerador de vídeo Conch AI: texto ou imagem para gerar vídeo de alta qualidade, criação de filmagens para filmes e TV

Introdução geral O Conch AI Video Generator é uma ferramenta avançada de geração de vídeo com IA desenvolvida pela MiniMax. Os usuários só precisam fornecer uma descrição de texto simples ou carregar imagens, e o Conch AI pode gerar rapidamente conteúdo de vídeo de alta qualidade. A ferramenta é amplamente usada por criadores, profissionais de marketing e...
8 meses atrás
02.1K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): um kit de ferramentas de aprendizagem profunda para geração de texto para fala com suporte multilíngue e recursos de clonagem de voz

Introdução abrangente O Coqui TTS é um kit de ferramentas de geração de texto para fala (TTS) avançado e de código aberto baseado em técnicas de aprendizagem profunda. Ele foi testado em ambientes de pesquisa e produção e oferece um rico conjunto de recursos e modelos que suportam a conversão de texto em fala em vários idiomas.
6 meses atrás
02K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2

Introdução abrangente O MockingBird é um projeto de código aberto que visa à clonagem rápida de fala e à conversão de texto em fala por meio da tecnologia de IA. Os usuários só precisam fornecer 5 segundos de amostras de voz, e você pode gerar qualquer conteúdo de voz. O projeto oferece suporte a uma variedade de conjuntos de dados chineses e, no Windows ...
8 meses atrás
02.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: ferramenta de clonagem de voz sem amostras em vários idiomas baseada em xtts_v2 para Windows com instalador de um clique.

Descrição geral O Clone Voice é uma ferramenta de clonagem de som de código aberto que fornece uma interface baseada na Web que permite aos usuários clonar vozes usando qualquer som ou gravação de voz pessoal. A ferramenta é fácil de usar, mesmo sem uma GPU NVIDIA, e pode ser usada com um aplicativo pré-compilado...
10 meses atrás
02.1K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

WebUI de conversão de voz com base em recuperação: uma estrutura para conversão de voz com base em recuperação e simulação de vozes cantadas na vida real

O Comprehensive Introduction Retrieval based Voice Conversion WebUI é uma estrutura de conversão de voz baseada em VITS fácil de usar que permite a conversão de voz entre quaisquer alto-falantes, inclusive covers de músicas e alterações de voz em tempo real. Ele tem baixo ...
10 meses atrás
02.1K
ReechoAI(睿声):超拟真AI语音合成与瞬时克隆平台

ReechoAI: plataforma de síntese de fala e clonagem instantânea de IA ultrafalsa

Introdução abrangente A Reecho AI (Reecho) é uma plataforma de clonagem instantânea e síntese de voz de IA de ultrafidelidade que utiliza tecnologia avançada de IA para permitir que os usuários criem e clonem rapidamente personagens de voz específicos carregando ou gravando uma amostra de áudio. A plataforma apresenta a capacidade de criar amostras de áudio a partir de...
10 meses atrás
02.1K
自得语音:智能语音合成平台|语音克隆

Zide Speech: plataforma inteligente de síntese de fala|clonagem de fala

Introdução abrangente O Zide Voice é uma plataforma de síntese de voz que usa tecnologia avançada de IA. Os usuários podem simplesmente carregar um trecho de voz, que pode ser complementado com texto para gerar clipes de voz realistas e emocionais. A plataforma é equipada com recursos como personalização rápida de personagens, geração de voz baseada em nuvem e síntese de voz antropomórfica. Não há necessidade de baixar nenhum software por meio de...
10 meses atrás
01.7K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: ferramenta de clonagem de fala e conversão de texto em fala de código aberto com amostra zero

Introdução abrangente O VoiceCraft é uma ferramenta de edição de fala de código aberto e de síntese de fala de amostra zero baseada no modelo de linguagem do codec neural. Ele emprega um método inovador de geração de sequência codificada que permite operações de inserção, exclusão e substituição em sequências de fala existentes para gerar uma fala editada natural e coerente...
10 meses atrás
02K
海藻AI:智能语音合成与声音克隆平台

Seaweed AI: plataforma inteligente de síntese de fala e clonagem de voz

Introdução abrangente O Seaweed AI é um produto de dublagem inteligente que pode converter texto em voz on-line, com base na plataforma aberta Yun Zhisheng AI. Os usuários podem se autoajudar para obter clonagem de voz e fornecer pronunciadores de IA de diferentes gêneros, sotaques e idiomas, e dublar diretamente a voz após a inserção do texto. Ele pode dublar rapidamente...
10 meses atrás
02K
Resemble AI:人工智能语音合成平台|声音克隆|深度伪造音频检测

Resemble AI: Plataforma de síntese de fala de inteligência artificial | Clonagem de voz | Detecção profunda de áudio falso

Introdução geral O Resemble AI é uma plataforma de síntese de voz com inteligência artificial projetada para empresas. A plataforma oferece tecnologia de ponta de geração de voz de IA e detecção de áudio falsificado profundo para a segurança futura das informações. Os recursos incluem clonagem de voz, detecção de áudio falso profundo em tempo real, tecnologia de marca d'água de IA...
10 meses atrás
02K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

Magic Voice Workshop: plataforma de criação de locução profissional e narração de vídeos curtos | locução de pessoa real | voz clone | um clique em um filme

Introdução abrangente O Magic Voice Workshop é uma plataforma completa de dublagem de vídeos curtos e de IA com informações sobre dublagem de software, dublagem real, bibliotecas de sons, serviços de clonagem e muito mais. A plataforma integra edição de áudio, geração de cópias de IA, edição de vídeo e ferramentas de colaboração para serviços relacionados a áudio e criação de conteúdo. Os usuários experimentam o editor de áudio...
10 meses atrás
01.6K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: gerador de fala com IA multilíngue, tecnologia transformadora de síntese de voz humana

Introdução geral O Listnr é um software de conversão de texto em fala com um mecanismo de IA generativo que cria síntese de fala em mais de 1.000 vozes diferentes em mais de 142 idiomas, incluindo a clonagem de sua própria voz. A plataforma atende a mais de 1 milhão de usuários em vídeos curtos, YouTub...
10 meses atrás
01.5K
度加:文案一键成片,急速克隆声音和剪辑精彩片段

Degree Plus: Redação em um filme com um clique, clonagem de som e edição de destaques com rapidez

Introdução abrangente A Duga Creation Tool é uma plataforma de criação de AIGC (Conteúdo Gerado por Inteligência Artificial) lançada pela Baidu, com o objetivo de reduzir o limite de geração de conteúdo e melhorar a eficiência da criação por meio da tecnologia de IA. A plataforma agrega os vários recursos de AIGC da Baidu para fornecer um serviço de criação em um só lugar, desde a inspiração até o produto final. O principal objetivo do Duga ...
11 meses atrás
01.8K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: música rap gerada por IA e plataforma de clonagem de voz | Text to Speech

Introdução geral O Uberduck AI é uma plataforma inovadora que fornece síntese de IA de vozes cantadas e faladas para agências criativas, produtores musicais e programadores. Os usuários podem escolher diferentes ritmos musicais, gerar letras usando IA ou escrever suas próprias letras, selecionar sons específicos e, por fim, criar músicas de rap...
11 meses atrás
02K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: ferramentas revolucionárias de geração de fala e clonagem de fala

Introdução abrangente O GPT-SoVITS é uma ferramenta de conversão e síntese de fala de código aberto que combina o modelo GPT e a tecnologia de troca de voz SoVITS. A ferramenta é compatível com a conversão de texto para fala em tempo real com zero e poucas amostras, e com a migração de estilo de voz com apenas 5 segundos de amostras de áudio. Seus recursos incluem a conversão entre idiomas ...
11 meses atrás
02.2K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Introdução abrangente O Easy-Voice-Toolkit é um kit de ferramentas multifuncional baseado no Open Source Speech Project, que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário...
11 meses atrás
02.1K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Gere vídeos digitais de fala humana com apenas uma foto, várias ferramentas gratuitas de geração de vídeo

Descrição geral O Vidnoz é uma plataforma gratuita de geração de vídeos com IA para criar rapidamente vídeos com IA em menos de 1 minuto. Não é necessário nenhum custo, download ou experiência. A plataforma oferece mais de 500 avatares de IA, mais de 470 locuções realistas de IA e mais de 500 modelos. Com o vídeo de IA do Vidnoz...
12 meses atrás
02.4K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: tradução multilíngue de vídeo com clonagem de fala profissional, ferramenta de localização de vídeo

Introdução geral A Rask AI é uma plataforma inteligente de localização de vídeo projetada para fornecer soluções rápidas de produção de áudio e vídeo para criadores, educadores e empresas globais. A plataforma oferece suporte à tradução automática de vídeo e áudio em mais de 130 idiomas para ajudar os usuários a expandir para mercados globais. Seus recursos especiais incluem vídeo...
12 meses atrás
02.5K
有道数字人:虚拟形象播报与实时交互平台|免费制作克隆数字人

Arigatou Digital Human: Plataforma de transmissão de imagens virtuais e interação em tempo real|Criação de clones digitais humanos gratuitos

Introdução abrangente A Wealth Digital People é uma plataforma que integra tecnologia avançada de IA, com foco no fornecimento de transmissão de imagens virtuais e serviços interativos em tempo real. A plataforma usa reconhecimento de fala, síntese de fala, percepção multimodal e tecnologia de Q&A de documentos desenvolvidos por ela mesma para criar um doppelgänger humano digital realista para os usuários, a fim de oferecer suporte à produção de vídeo, tradução, ensino...
12 meses atrás
01.9K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell): clonagem instantânea de fala em vários idiomas com menos amostras

Introdução geral O OpenVoice é um método versátil de clonagem instantânea de fala que permite copiar a voz de um locutor de referência e gerar fala multilíngue usando apenas clipes de áudio curtos do locutor. Além de copiar tons, o OpenVoice permite um controle preciso sobre o estilo da voz, incluindo...
9 meses atrás
02.1K