Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)
综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与语音对齐信息,采用两阶段的生成方式,首先通...
综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与语音对齐信息,采用两阶段的生成方式,首先通...
综合介绍 趣丸千音是一款多语种AI语音合成平台,提供逼真自然的声音生成方案。用户可以轻松将文本内容转换成专业级音频,支持从零样本创建专属AI语音(语音克隆),满足个性化需求。平台还提供视频翻译功能,帮助...
GizAI 是一个集成了AI生成、笔记和云存储功能的一站式平台。用户可以通过GizAI生成图像、视频、音频、文本、角色、故事和游戏,并且可以在平台上进行协作笔记和云存储。GizAI 提供了多种AI工具,帮助用户提高生产力和创造力,同时保护用户隐私,不会在未经同意的情况下使用用户数据进行AI训练。 GizAI 由 Giz Inc. 运营,成立于 Stripe Atlas,并获得 Google for Startups Cloud、Microsoft for Startups Founders Hub、AWS Activate 和 Paddle AI LaunchPad 等项目的支持。GizAI 坚信 使用先进的 生成式AI技术 是每个人的权力,提供免费的广告支持计划,允许用户生成、协作和分享内容。
综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音合成。CosyVoice不仅支...
综合介绍 Coqui TTS 是一个开源的高级文本到语音(TTS)生成工具包,基于深度学习技术。它经过研究和生产环境的实战测试,提供了丰富的功能和模型,支持多种语言的文本到语音转换。Coqui TTS 不仅支持预训练模型...
综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示,使其更容易与语音对齐,从而显著提升了合成质...
综合介绍 Voice Changer 是一个开源的实时语音变换工具,支持多种 AI 语音模型,如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台,包括 Windows、Mac、Linux 和 Google Colab,用户可以通...
综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows 和 Linux 系统上运行良好...
综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应用程序在本地运行。它支...
综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点...
综合介绍 Reecho AI(睿声)是一个超拟真AI语音合成与瞬时克隆平台,利用先进的人工智能技术,用户可以通过上传或录制一段音频样本,快速创建并克隆特定的声音角色。该平台的特点是能够从较短的音频样本中快速克...