
Orate:集成知名语音生成、语音转录与变声模型的统一API
综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼真、类人语音并将音频转录为文本。Ora...
综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼真、类人语音并将音频转录为文本。Ora...
综合介绍 Weights 是一个利用 AI 进行创作的社交平台,用户可以通过简单的操作创建语音翻唱、文本转语音、图像、音乐和视频等内容。平台提供了丰富的工具和模板,帮助用户快速上手创作,并与社区分享自己的作品。...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 AnyVoice 是一个先进的 AI 语音生成平台,提供超真实的语音生成和声音克隆服务。用户可以通过该平台将文本转换为自然的语音,并且可以在数百种预设声音中进行选择。如果找不到合适的声音,只需3秒录音即...
综合介绍 Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话,并输出为MP3文件。该项目受N...
综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多种语言,还能实现情感表达和个性...
综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持多种语言,包括英语,并计划支持法语、日语、韩语...
综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项...
综合介绍 Jellypod 是一个功能强大的 AI 播客工作室,旨在帮助用户轻松创建、编辑和发布高质量的 AI 播客。通过 Jellypod,用户可以设计个性化的播客主持人,完善脚本,并将播客发布到 Spotify、YouTube、Apple P...
综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspberry Pi 等,能够在没有网络连接的情况下进行实时...
综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单的命令行操作,即可将电子书转...
综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音(TTS)服务平台,利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具,使用户无需使用多种软件即可完成视频制作。Acoust 支持超过 30 种语...
综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能,使得生成长文本的语音输出更加高效和连贯。项目...
综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发布,支持多种语音包(Voicepacks),可以生...
综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Coqui的XTTSv2和Fairseq进...
综合介绍 Edge TTS Worker(依赖 edge-tts ) 是一个部署在 Cloudflare Worker 上的代理服务,它将微软 Edge TTS 服务封装成兼容 OpenAI 格式的 API 接口。通过本项目,用户可以在没有微软认证的情况下,轻松使用...
综合介绍 ViiTor AI 是一个强大的人工智能平台,专注于提供高质量的视频翻译、语音克隆、AI生成的虚拟形象视频以及语音合成服务。该平台支持多种语言,旨在帮助用户轻松实现多语言内容创作。ViiTor AI 的视频翻译...
综合介绍 Wondercraft 是一个革命性的AI驱动音视频创作平台,为内容创作者提供了一站式的音视频制作解决方案。平台运用先进的人工智能技术,能够将文字内容转换为自然流畅的语音,支持20多种语言,提供200多种AI...
综合介绍 NotebookLM Podcast 是一个创新的平台,利用人工智能技术将任何文本内容转化为动态、引人入胜的音频播客。无论你是学生、教育者、内容创作者还是忙碌的专业人士,NotebookLM Podcast 都能为你提供个性化...
综合介绍 AivisSpeech 是一个基于 VOICEVOX 编辑器 UI 的日语语音合成软件。它集成了 AivisSpeech Engine,可以轻松生成情感丰富的语音。AivisSpeech 支持多种音声合成模型,用户可以通过简单的操作生成高质量的...