
Seed-VC:支持少样本实时转换语音和歌声
综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延迟低至 400 毫秒左右,适合在线会...
综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延迟低至 400 毫秒左右,适合在线会...
综合介绍 CSM Voice Cloning 是一个由 Isaiah Bjork 开发的开源项目,托管在 GitHub 上。它基于 Sesame CSM-1B 模型,用户只需提供一段音频样本,就能克隆自己的声音并生成带有个人特色的语音。这个工具支持本地 ...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用...
综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语音。它基于先进的深度学习技术,支持多种语言和声...
综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川话)、可...
综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型,能够生成高质量的语音输出。该工具支持多种语言,包括英语、日语、中文、法语和德语,...
综合介绍 Weights 是一个利用 AI 进行创作的社交平台,用户可以通过简单的操作创建语音翻唱、文本转语音、图像、音乐和视频等内容。平台提供了丰富的工具和模板,帮助用户快速上手创作,并与社区分享自己的作品。...
综合介绍 AnyVoice 是一个先进的 AI 语音生成平台,提供超真实的语音生成和声音克隆服务。用户可以通过该平台将文本转换为自然的语音,并且可以在数百种预设声音中进行选择。如果找不到合适的声音,只需3秒录音即...
综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多种语言,还能实现情感表达和个性...
综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语义标记架构设计,无需依赖Whisper...
综合介绍 ViiTor AI 是一个强大的人工智能平台,专注于提供高质量的视频翻译、语音克隆、AI生成的虚拟形象视频以及语音合成服务。该平台支持多种语言,旨在帮助用户轻松实现多语言内容创作。ViiTor AI 的视频翻译...
综合介绍 Voicemod是一款领先的实时变声器和声音特效软件,适用于Windows和macOS系统。无论你是在游戏中进行角色扮演、与朋友聊天,还是进行直播,Voicemod都能为你提供丰富的声音变化效果。通过AI技术,Voicemod...
综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与语音对齐信息,采用两阶段的生成方式,首先通...
综合介绍 趣丸千音是一款多语种AI语音合成平台,提供逼真自然的声音生成方案。用户可以轻松将文本内容转换成专业级音频,支持从零样本创建专属AI语音(语音克隆),满足个性化需求。平台还提供视频翻译功能,帮助...
综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音合成。CosyVoice不仅支...
综合介绍 海螺AI视频生成器是由MiniMax公司开发的一款先进的AI视频生成工具。用户只需提供简单的文本描述或上传图片,海螺AI即可快速生成高质量的视频内容。该工具广泛应用于创作者、市场营销人员和故事讲述者,...
综合介绍 Coqui TTS 是一个开源的高级文本到语音(TTS)生成工具包,基于深度学习技术。它经过研究和生产环境的实战测试,提供了丰富的功能和模型,支持多种语言的文本到语音转换。Coqui TTS 不仅支持预训练模型...
综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示,使其更容易与语音对齐,从而显著提升了合成质...
综合介绍 Voice Changer 是一个开源的实时语音变换工具,支持多种 AI 语音模型,如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台,包括 Windows、Mac、Linux 和 Google Colab,用户可以通...