
csm-mlx:苹果设备专用的 csm 语音生成模型
综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用户可以用简单的方式在苹果设备上运行高效的语音生成和对...
综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用户可以用简单的方式在苹果设备上运行高效的语音生成和对...
综合介绍 Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由 David Nesbitt 开发,遵循 MIT ...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用...
综合介绍 MLX-Audio 是一个基于 Apple MLX 框架开发的开源工具,专注于文本转语音(TTS)和语音转语音(STS)功能。它充分利用 Apple Silicon(如 M 系列芯片)的强大计算能力,提供高效、快速的语音合成解决方案...
综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语音。它基于先进的深度学习技术,支持多种语言和声...
综合介绍 “猫与星”(maoyuxing.com)是一个专为儿童设计的互动故事创作平台,通过手机应用帮助家长和孩子共同打造个性化的童话故事。用户可以输入孩子的姓名、喜好等信息,生成独一无二的故事内容,让孩子成为故...
综合介绍 TTS Importer 是一个开源项目,旨在将 Azure TTS(Text-to-Speech)语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件,包括阅读(legado)、爱阅记、源阅读等。通过 TTS Importer,...
综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVIDIA Inference Microservices)技术,能够在私有网络上安全运...
综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能够在浏览器中本地运行高效的文本转语音转换。WebGPU是一种现代...
综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼真、类人语音并将音频转录为文本。Ora...
综合介绍 Weights 是一个利用 AI 进行创作的社交平台,用户可以通过简单的操作创建语音翻唱、文本转语音、图像、音乐和视频等内容。平台提供了丰富的工具和模板,帮助用户快速上手创作,并与社区分享自己的作品。...
综合介绍 AnyVoice 是一个先进的 AI 语音生成平台,提供超真实的语音生成和声音克隆服务。用户可以通过该平台将文本转换为自然的语音,并且可以在数百种预设声音中进行选择。如果找不到合适的声音,只需3秒录音即...
综合介绍 Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话,并输出为MP3文件。该项目受N...
综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多种语言,还能实现情感表达和个性...
综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持多种语言,包括英语,并计划支持法语、日语、韩语...
综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项...
综合介绍 Jellypod 是一个功能强大的 AI 播客工作室,旨在帮助用户轻松创建、编辑和发布高质量的 AI 播客。通过 Jellypod,用户可以设计个性化的播客主持人,完善脚本,并将播客发布到 Spotify、YouTube、Apple P...
综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspberry Pi 等,能够在没有网络连接的情况下进行实时...
综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单的命令行操作,即可将电子书转...