
Acoust:在线AI语音生成和文本转语音(TTS)服务平台
综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音(TTS)服务平台,利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具,使用户无需使用多种软件即可完成视频制作。Acoust 支持超过 30 种语...
综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音(TTS)服务平台,利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具,使用户无需使用多种软件即可完成视频制作。Acoust 支持超过 30 种语...
综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能,使得生成长文本的语音输出更加高效和连贯。项目...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发布,支持多种语音包(Voicepacks),可以生...
综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Coqui的XTTSv2和Fairseq进...
综合介绍 Edge TTS Worker(依赖 edge-tts ) 是一个部署在 Cloudflare Worker 上的代理服务,它将微软 Edge TTS 服务封装成兼容 OpenAI 格式的 API 接口。通过本项目,用户可以在没有微软认证的情况下,轻松使用...
综合介绍 ViiTor AI 是一个强大的人工智能平台,专注于提供高质量的视频翻译、语音克隆、AI生成的虚拟形象视频以及语音合成服务。该平台支持多种语言,旨在帮助用户轻松实现多语言内容创作。ViiTor AI 的视频翻译...
综合介绍 Wondercraft 是一个革命性的AI驱动音视频创作平台,为内容创作者提供了一站式的音视频制作解决方案。平台运用先进的人工智能技术,能够将文字内容转换为自然流畅的语音,支持20多种语言,提供200多种AI...
综合介绍 NotebookLM Podcast 是一个创新的平台,利用人工智能技术将任何文本内容转化为动态、引人入胜的音频播客。无论你是学生、教育者、内容创作者还是忙碌的专业人士,NotebookLM Podcast 都能为你提供个性化...
综合介绍 AivisSpeech 是一个基于 VOICEVOX 编辑器 UI 的日语语音合成软件。它集成了 AivisSpeech Engine,可以轻松生成情感丰富的语音。AivisSpeech 支持多种音声合成模型,用户可以通过简单的操作生成高质量的...
综合介绍 PlayAI 是一个专注于语音生成和语音克隆的人工智能平台。它提供了多种语音模型,能够生成流畅、富有情感的对话。用户可以通过该平台创建个性化的语音代理,提升互动体验。PlayAI 的技术适用于各种应用场...
综合介绍 GizAI 是一个集成了AI生成、笔记和云存储功能的一站式平台。用户可以通过GizAI生成图像、视频、音频、文本、角色、故事和游戏,并且可以在平台上进行协作笔记和云存储。GizAI 提供了多种AI工具,帮助用...
综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构,支持语音克隆功能,能够生成...
综合介绍 PodLM 是一个先进的 AI 播客生成平台,旨在帮助用户将文本、文档或网址内容快速转换为高质量的播客音频。通过利用尖端的 AI 技术,PodLM 能够自动生成结构化且引人入胜的播客脚本,并将其转换为专业质量...
综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项目基于 Gradi...
综合介绍 逗哥配音是一款广受欢迎的AI配音软件,拥有超过500万用户。该软件利用先进的AI智能配音技术,提供专业且逼真的配音效果,适用于短视频、广告制作、教育培训等多种场景。逗哥配音致力于为用户提供快速便...
综合介绍 YouTube Dubbing 是一个智能配音平台,专为视频创作者和观众提供多语种配音服务。通过AI技术,该平台能够将YouTube视频自动翻译并生成配音,支持多种语言和语音风格。用户只需安装插件,即可在观看视频...
综合介绍 Podcastfy 是一个开源的 Python 软件包,利用生成式人工智能(GenAI)技术,将网页内容、PDF 文件、文本、图像、youtube 视频等多种来源的内容转换为引人入胜的多语言音频对话。与传统的基于用户界面的...
综合介绍 QuickPiperAudiobook 是一个开源项目,旨在通过简单的一条命令,将各种文本格式(如 epub、mobi、txt、PDF、HTML 等)转换为自然音质的有声书。该工具使用 Piper 模型进行转换,并管理 Piper 的安装和相...
综合介绍 PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频内容,如播客、讲座和摘要。该工具利用 OpenAI 的 GPT 模型进行文本生成和文本到语音转换,用户可以上传多个 PDF 文件,选择不同的指令模板(如播...