
Orpheus-TTS:生成自然中文语音的文本转语音工具
综合介绍 Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语、德语、意大利语、葡萄牙语和汉语等...
综合介绍 Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语、德语、意大利语、葡萄牙语和汉语等...
综合介绍 ElevenLabs MCP 是 ElevenLabs 官方推出的开源项目,托管在 GitHub 上。它是一个基于模型控制协议(Model Context Protocol, MCP)的服务器工具,旨在连接 AI 模型和 ElevenLabs 的语音与音频处理功能。...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Vapi 是一个专为开发者打造的语音AI平台。它能让用户在几分钟内构建、测试和部署语音AI助手,解决传统语音应用开发耗时长、扩展难的问题。Vapi 提供完整的工具和基础设施,支持实时对话、电话集成和多平...
综合介绍 MiniMax Audio 是 MiniMax 公司推出的一款 AI 语音生成工具,核心特点是快速将文字转为高相似度的自然语音。它基于 Speech-02 模型,语音合成相似度高达 99%,音质达到录音室级别,支持超过 30 种语言和...
综合介绍 Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让用户可以通过界面轻松把文字变成语音。项...
综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 OpenAI TTS、AWS Polly 和 MiniMax 三...
综合介绍 Paper to Podcast 是一个开源工具,专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术,将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话,让复杂的学术内容变得简单易懂。这...
综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具,专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数,轻量高效,支持中英文混合语音生成和语音克隆。项目托管在 GitHub 上,提...
综合介绍 Podcastle 是一个基于人工智能的在线平台,专门帮助用户快速创建和编辑高质量的播客。它集成了录音、编辑和发布功能,用户无需专业设备或复杂软件,只需通过浏览器就能完成所有操作。平台利用 AI 技术提...
综合介绍 IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且高质量的语音合成。IndexTTS 使用了数万小时的数...
综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用户可以用简单的方式在苹果设备上运行高效的语音生成和对...
综合介绍 Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由 David Nesbitt 开发,遵循 MIT ...
综合介绍 PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用...
综合介绍 MLX-Audio 是一个基于 Apple MLX 框架开发的开源工具,专注于文本转语音(TTS)和语音转语音(STS)功能。它充分利用 Apple Silicon(如 M 系列芯片)的强大计算能力,提供高效、快速的语音合成解决方案...
综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语音。它基于先进的深度学习技术,支持多种语言和声...
综合介绍 “猫与星”(maoyuxing.com)是一个专为儿童设计的互动故事创作平台,通过手机应用帮助家长和孩子共同打造个性化的童话故事。用户可以输入孩子的姓名、喜好等信息,生成独一无二的故事内容,让孩子成为故...
综合介绍 TTS Importer 是一个开源项目,旨在将 Azure TTS(Text-to-Speech)语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件,包括阅读(legado)、爱阅记、源阅读等。通过 TTS Importer,...
综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVIDIA Inference Microservices)技术,能够在私有网络上安全运...
综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能够在浏览器中本地运行高效的文本转语音转换。WebGPU是一种现代...