Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)
综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与语音对齐信息,采用两阶段的生成方式,首先通...
综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与语音对齐信息,采用两阶段的生成方式,首先通...
综合介绍 Quanta Quest是全球首个以“端侧大模型+C端数据本地化”为核心演进方向的产品。它帮助用户将Gmail、Notion、Dropbox等所有数据存储到本地,并通过向量数据库进行处理,确保数据的安全和隐私。Quanta Quest...
GizAI 是一个集成了AI生成、笔记和云存储功能的一站式平台。用户可以通过GizAI生成图像、视频、音频、文本、角色、故事和游戏,并且可以在平台上进行协作笔记和云存储。GizAI 提供了多种AI工具,帮助用户提高生产力和创造力,同时保护用户隐私,不会在未经同意的情况下使用用户数据进行AI训练。 GizAI 由 Giz Inc. 运营,成立于 Stripe Atlas,并获得 Google for Startups Cloud、Microsoft for Startups Founders Hub、AWS Activate 和 Paddle AI LaunchPad 等项目的支持。GizAI 坚信 使用先进的 生成式AI技术 是每个人的权力,提供免费的广告支持计划,允许用户生成、协作和分享内容。
综合介绍 Local File Organizer 是一个由 AI 驱动的本地文件管理工具,旨在帮助用户整理和分类计算机上的文件。该工具利用先进的 AI 模型,如 Llama3.2 3B 和 Llava v1.6,通过 Nexa SDK 实现文件的智能扫描、重...
综合介绍 受 Notebook LM 的播客生成特性和最近的 Open Notebook LM 开源实现的启发。在本食谱中,我们将实现一个关于如何构建 PDF 到播客管道的详细步骤。 给定任何 PDF,我们将生成一段主持人与嘉宾讨论和解释 ...
综合介绍 Agent.exe 是一个开源的 Electron 应用程序,利用 Anthropic 的 Claude 3.5 Sonnet API,让用户可以通过 AI 直接控制本地计算机。该项目由 Kyle Corbitt 开发,旨在提供一个轻量级的解决方案,让用户体...
综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体框架,实现对...
综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音合成。CosyVoice不仅支...
综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架,旨在简化和自动化日常计算机任务,使人工智能更易于使用。它通过模块化设计和预设提示词(Patterns)帮助用户高效处理各种事务,如内容总结、数据提取...
综合介绍 NocoDB 是一个开源的Airtable替代方案,旨在提供一个强大且易于使用的在线数据库管理工具。通过NocoDB,用户可以轻松创建、读取、更新和删除数据库中的数据,无需编写代码。该平台支持多种数据库类型,...
综合介绍 一个用于修复无效JSON文件的模块,特别适用于解析由大型语言模型(LLMs)输出的错误JSON数据。该模块能够修复常见的JSON语法错误,如缺失的引号、错误的逗号、不转义的字符和不完整的键值对。它还可以自...