AI语音克隆

共 41 篇文章

排序

浏览收藏

海螺语音(MiniMax Audio)：生成自然语音的AI工具

综合介绍 MiniMax Audio 是 MiniMax 公司推出的一款 AI 语音生成工具，核心特点是快速将文字转为高相似度的自然语音。它基于 Speech-02 模型，语音合成相似度高达 99...

最新AI资源 # AI文本转语音 # AI语音克隆

10个月前

0126K

MegaTTS3：合成中英文语音的轻量模型

综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具，专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数，轻量高效，支持中英文混合语音生成和语音克隆。项目托管在...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

067K

Seed-VC：支持少样本实时转换语音和歌声

综合介绍 Seed-VC 是一个开源项目，地址在 GitHub 上，由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频，快速实现语音或歌声转换，不需要额外训练。项目支持实时语音转换，延...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0160.5K

CSM Voice Cloning：利用CSM-1B快速克隆声音

综合介绍 CSM Voice Cloning 是一个由 Isaiah Bjork 开发的开源项目，托管在 GitHub 上。它基于 Sesame CSM-1B 模型，用户只需提供一段音频样本，就能克隆...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

053.2K

PlayHT：生成超真实语音的AI工具

综合介绍 PlayHT 是一个专注于AI语音生成的高效在线平台，帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音，支持60多种语言和多样化的口音，适用于播客制作、教育内容、营销推广...

最新AI资源 # AI文本转语音 # AI语音克隆

1年前

054.9K

Spark-TTS：生成自然语音的文本转语音工具

综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音（Text-to-Speech, TTS）工具，托管在 GitHub 上，旨在帮助用户将文本高效转换为自然流畅的语...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

070.7K

Step-Audio：多模态语音交互框架，识别语音并使用克隆语音交流等功能

综合介绍 Step-Audio 是一个开源的智能语音交互框架，旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话（如中文、英文、日语）、情感语音（如快乐、悲伤）、区域方言（如粤语、四川...

最新AI资源 # AI开源项目 # AI语音克隆 # 多模态实时互动产品

1年前

071K

Zonos：高质量语音合成与语音克隆工具

综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型，能够生成高质量的语音输出。该工具支持多种语言...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

065.5K

Weights：模仿声音翻唱歌曲和文本转语音的创作平台

综合介绍 Weights 是一个利用 AI 进行创作的社交平台，用户可以通过简单的操作创建语音翻唱、文本转语音、图像、音乐和视频等内容。平台提供了丰富的工具和模板，帮助用户快速上手创作，并与社区分享自...

最新AI资源 # AI文本转语音 # AI语音克隆

1年前

0119.5K

AnyVoice：在线免费克隆声音，只要3秒实现语音克隆

综合介绍 AnyVoice 是一个先进的 AI 语音生成平台，提供超真实的语音生成和声音克隆服务。用户可以通过该平台将文本转换为自然的语音，并且可以在数百种预设声音中进行选择。如果找不到合适的声音，只...

最新AI资源 # AI文本转语音 # AI语音克隆

1年前

079.8K

Llasa 1~8B：高品质语音生成和克隆的开源文本转语音模型

综合介绍 Llasa-3B是由香港科技大学音频实验室（HKUST Audio）开发的一个开源文本转语音（TTS）模型。该模型基于Llama 3.2B架构，经过细致调优，提供高质量的语音生成，不仅支持多...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

072.4K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统，基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统，其最大特点是采用创新的无语...

最新AI资源 # AI开源项目 # AI语音克隆 # 多模态实时互动产品

1年前

069.1K

ViiTor AI：音频/视频多语言翻译合成与语音克隆服务

综合介绍 ViiTor AI 是一个强大的人工智能平台，专注于提供高质量的视频翻译、语音克隆、AI生成的虚拟形象视频以及语音合成服务。该平台支持多种语言，旨在帮助用户轻松实现多语言内容创作。ViiTo...

最新AI资源 # AI文本转语音 # AI语音克隆 # AI音视频编辑

1年前

079.5K

Voicemod：实时变声器，语音聊天、游戏变声

综合介绍 Voicemod是一款领先的实时变声器和声音特效软件，适用于Windows和macOS系统。无论你是在游戏中进行角色扮演、与朋友聊天，还是进行直播，Voicemod都能为你提供丰富的声音变化...

最新AI资源 # AI语音克隆

1年前

078.2K

Amphion MaskGCT：零样本文本到语音克隆模型（本地一键部署包）

综合介绍 MaskGCT（Masked Generative Codec Transformer）是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音（TTS）模型。该模型无需显式的文本与...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

083.1K

趣丸千音：语音克隆并结合口型同步，一键翻译视频为多语言！

综合介绍趣丸千音是一款多语种AI语音合成平台，提供逼真自然的声音生成方案。用户可以轻松将文本内容转换成专业级音频，支持从零样本创建专属AI语音（语音克隆），满足个性化需求。平台还提供视频翻译功能，帮...

最新AI资源 # AI翻译 # AI语音克隆

1年前

050.7K

CosyVoice：阿里推出的3秒急速语音克隆开源项目，支持情感控制标签

综合介绍 CosyVoice是一个多语言大规模语音生成模型，提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发，旨在通过先进的自回归变换器和基于ODE的扩散模型，实现高质量的语音...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0161.9K

海螺AI视频生成器：文本或图像生成高质量视频，影视级镜头创作

综合介绍海螺AI视频生成器是由MiniMax公司开发的一款先进的AI视频生成工具。用户只需提供简单的文本描述或上传图片，海螺AI即可快速生成高质量的视频内容。该工具广泛应用于创作者、市场营销人员和故...

最新AI资源 # AI图像转视频 # AI文本转视频 # AI语音克隆

1年前

072.2K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

综合介绍 Coqui TTS 是一个开源的高级文本到语音（TTS）生成工具包，基于深度学习技术。它经过研究和生产环境的实战测试，提供了丰富的功能和模型，支持多种语言的文本到语音转换。Coqui TTS...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0107.4K

F5-TTS：少样本语音克隆，生成流畅且感情丰富的克隆声音

综合介绍 F5-TTS 是一种新型非自回归文本到语音（TTS）系统，基于流匹配的扩散变换器（Diffusion Transformer, DiT）。该系统通过使用 ConvNeXt 模型来优化文本表示...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

092.4K

Voice Changer：实时语音变换工具，让喜欢的动漫角色唱歌

综合介绍 Voice Changer 是一个开源的实时语音变换工具，支持多种 AI 语音模型，如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

067.3K

MockingBird：快速克隆声音与模型训练，基于 xtts v2 实现的文本转语音

综合介绍 MockingBird 是一个开源项目，旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本，即可生成任意语音内容。该项目支持多种中文数据集，并在 Windows...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

060.2K

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

综合介绍 Clone Voice 是一个开源的声音克隆工具，提供了一个基于Web的界面，允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单，即使没有NVIDIA GPU，也可以通过预编译的应...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

074.9K

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架，可以实现任意说话人之间的语音转换，包括歌曲的翻唱和实时的变声。它具有低...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

065.1K

ReechoAI（睿声）：超拟真AI语音合成与瞬时克隆平台

综合介绍 Reecho AI（睿声）是一个超拟真AI语音合成与瞬时克隆平台，利用先进的人工智能技术，用户可以通过上传或录制一段音频样本，快速创建并克隆特定的声音角色。该平台的特点是能够从较短的音频样本...

最新AI资源 # AI语音克隆

1年前

055.7K

自得语音：智能语音合成平台|语音克隆

综合介绍自得语音是一款采用先进AI技术的语音合成平台。用户可简单上传一段语音，即可辅以文本生成逼真、富有情感的语音片段。平台具备快速定制角色、云端语音生成、拟人语音合成等功能。无需下载任何软件，通过...

最新AI资源 # AI语音克隆

1年前

055.3K

VoiceCraft：开源零样本语音克隆与文本转语音工具

综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具，基于神经编解码器语言模型。它采用了创新的编码序列生成方法，能够在已有语音序列上进行插入、删除和替换操作，生成自然、连贯的编辑语音...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

065.2K

海藻AI：智能语音合成与声音克隆平台

综合介绍海藻AI是一款可以在线将文字转成语音的智能配音产品，由云知声AI开放平台提供技术支持。用户可以自助实现声音克隆，并提供不同性别、不同口音、不同语种的AI发音人，输入文字后直接配音。可快速对短...

最新AI资源 # AI文本转语音 # AI语音克隆

1年前

048.5K

Resemble AI：人工智能语音合成平台|声音克隆|深度伪造音频检测

综合介绍 Resemble AI是一款专为企业设计的人工智能语音合成平台。平台提供前沿的AI语音生成器技术，以及面向未来信息安全的深度伪造音频检测。功能包含声音克隆、实时深度伪造音频检测、AI水印技术...

最新AI资源 # AI文本转语音 # AI语音克隆

1年前

056K

魔音工坊：专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

综合介绍魔音工坊是一站式短视频及AI配音平台，具备软件配音、真人配音、声库、克隆服务等信息。平台集音频编辑、AI文案生成、视频编辑及协作工具于一体，适用于音频相关服务和内容创作。用户体验了音频编辑器...

最新AI资源 # AI文本转语音 # AI语音克隆 # AI音视频编辑

1年前

064.8K

Listnr：多语言AI语音生成器，变革性人声合成技术

综合介绍 Listnr是一款采用生成式AI引擎的文本转语音软件，能够以1000+不同声音在142+种语言中创造语音合成，包括克隆您自己的声音。该平台为超过100万用户提供服务，涵盖短视频、YouTub...

最新AI资源 # AI文本转语音 # AI语音克隆

1年前

060.1K

度加：文案一键成片，急速克隆声音和剪辑精彩片段

综合介绍度加创作工具是百度推出的AIGC（人工智能生成内容）创作平台，旨在通过AI技术降低内容生成的门槛，提升创作效率。该平台聚合了百度的多种AIGC能力，提供从灵感到成品的一站式创作服务。度加的主...

最新AI资源 # AI文本转视频 # AI语音克隆 # AI音视频编辑

2年前

051.4K

Uberduck：AI生成说唱音乐与声音克隆平台|文本转语音

综合介绍 Uberduck AI是一个创新平台，为创意机构、音乐制作人和程序员提供AI合成歌声和说话声音服务。用户可以选择不同的音乐节奏、利用AI生成歌词或自行编写，选择特定声音，最终创作rap歌曲...

最新AI资源 # AI文本转语音 # AI语音克隆 # AI音乐

2年前

056.6K

GPT SoVITS：革命性的语音生成与语音克隆工具

综合介绍 GPT-SoVITS是一款开源的语音转换与合成工具，结合了GPT模型和SoVITS变声器技术。该工具支持零样本与少量样本的即时文本转语音，仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

079.3K

Fish Speech：快速且高精度使用少样本克隆中英文语音

综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音（TTS）合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术，能够将文本转换成逼真的语音。Fish S...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

079.3K

ElevenLabs：高质量AI语音生成平台,文字配音和语音克隆工具

综合介绍 ElevenLabs是一家总部位于美国纽约的初创公司，专注于生成式AI语音领域。该公司提供了一系列功能强大的文本生成语音、语音生成语音、语音克隆和语音识别等服务。ElevenLabs的优势在...

最新AI资源 # AI文本转语音 # AI语音克隆

2年前

055.3K

Easy Voice Toolkit：本地部署的AI语音工具箱

综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱，提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

2年前

060.5K

Vidnoz AI：只需一张照片即可生成数字人演讲视频，多种免费视频生成工具

综合介绍 Vidnoz是一款免费的AI视频生成平台，可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物，470+逼真AI配音以及500+模板。通过Vidnoz AI视...

最新AI资源 # AI图像转视频 # AI数字人 # AI文本转视频

2年前

080K

Rask AI：视频多语言翻译与专业语音克隆，视频本地化工具

综合介绍 Rask AI 是一个智能视频本地化平台，专为创作者、教育者和全球企业提供快速的音视频生产解决方案。平台支持将视频和音频自动翻译成130多种语言，帮助用户扩展全球市场。其特色功能包括视频...

最新AI资源 # AI语音克隆

2年前

053.2K

有道数字人：虚拟形象播报与实时交互平台|免费制作克隆数字人

综合介绍有道数字人是一个集成了先进AI技术的平台，专注于提供虚拟形象播报和实时交互服务。平台利用自研的语音识别、语音合成、多模态感知和文档问答技术，为用户打造逼真的数字人分身，支持视频制作、翻译、教...

最新AI资源 # AI数字人 # AI语音克隆

2年前

049.1K

OpenVoice(MyShell)：多语言少样本即时语音克隆

综合介绍 OpenVoice 是一个多功能的即时语音克隆方法，仅需使用参考说话者的短音频片段，即可复制其声音并生成多语言的语音。除了复制音色外，OpenVoice 还允许精细控制语音风格，包括情感...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0150.3K

没有了