
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型
综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Chat 能够理解用户的语调,可以在...
综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Chat 能够理解用户的语调,可以在...
QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统,支持各类文件格式及数据库,可离线安装使用。它可以处理PDF、Word、PPT、XLS等多种格式的文件,支持跨...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 stickerbaker是一个开源的贴纸制作工具,利用人工智能技术来制作各种有趣的贴纸。无论是想要一个简单的猫咪贴纸还是想要制作一系列多样化的贴纸,stickerbaker都能满足你的需求。只需简单描述你想要的贴...
综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文字,并进行智能分析...
综合介绍 OpenSPG是由蚂蚁集团与OpenKG合作开发的开源知识图谱引擎,基于SPG(语义增强可编程图)框架。该引擎旨在提供显式语义表示、逻辑规则定义和操作框架等功能,支持领域知识图谱的构建和管理。OpenSPG结合...
综合介绍 Mem0(发音为“mem-zero”)是一个为AI助手和代理提供智能记忆层的开源项目。它能够记住用户偏好,适应个体需求,并随着时间的推移不断改进,使其成为客户支持聊天机器人、AI助手和自主系统的理想选择。Me...
综合介绍 Void是一个开源的Cursor替代品,基于vscode仓库的分支。它提供了一个强大的开发环境,旨在为开发者提供更高效的编码体验。Void的目标是通过社区贡献和快速迭代,不断提升其功能和稳定性。用户可以通过Gi...
综合介绍 GaiaNet-AI/gaianet-node是一个开源项目,允许用户在Mac、Linux或Windows WSL上通过一条命令快速安装默认的节点软件栈。用户可以初始化节点,自定义配置,下载模型文件和向量数据库文件,进而启动AI代理...
综合介绍 LlamaCoder 是一个基于 Llama 3.1 和 Together AI 的开源代码生成工具。它可以通过简单的提示生成小型应用程序,适合开发者快速实现创意。LlamaCoder 提供了丰富的功能模块和灵活的自定义选项,支持多种...
综合介绍 awesome-cursorrules 是一个专门为 Cursor AI 提供自定义规则文件的项目。Cursor AI 是一个由人工智能驱动的代码编辑器,.cursorrules 文件可以定义 AI 在生成代码时遵循的自定义规则,从而使其行为更符...
综合介绍 MathTranslate 是一个专门用于翻译 LaTeX 文档的在线工具,特别适用于科学论文的翻译。该工具能够保持 LaTeX 表达式(如数学表达式)不变,并最终将 LaTeX 文档编译成 PDF 文件。MathTranslate 提供了一...
综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格式化文本识别、细粒度OCR、多...
综合介绍 tgwechat是一个开源微信插件,由开发者dplusec开发。它通过端到端加密技术保护微信聊天隐私,让用户能安全地发送消息。项目于2019年8月31日在GitHub上线,采用GPL v3许可证,免费供个人使用。tgwechat的...
综合介绍 OpenSumi Lite 是一个基于 OpenSumi 项目的纯前端 IDE 解决方案,旨在提供无需 Node.js 环境的代码查看与编辑功能。该项目由阿里巴巴集团和蚂蚁集团共同开发,采用 MIT 许可证开源。OpenSumi Lite 通过...
综合介绍 Forecast AI 是一个基于先进人工智能技术的超级预测平台。它利用强大的数据分析和机器学习算法,为用户提供高精度的未来事件预测。无论是政治选举、经济趋势还是社会事件,Forecast AI 都能通过综合多种...
综合介绍 GPT-SoVITS是一款开源的语音转换与合成工具,结合了GPT模型和SoVITS变声器技术。该工具支持零样本与少量样本的即时文本转语音,仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语言支持、内置音轨分...
综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音(TTS)合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术,能够将文本转换成逼真的语音。Fish Speech不仅支持多种语言,还提供了高效的语音合成...
综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS Toucan 旨在为研究、教...
综合介绍 Product Hunt 每日中文热榜是一个基于 GitHub Actions 的自动化工具,能够每天定时生成 Product Hunt 上的热门产品榜单,并以 Markdown 文件的形式提交到 GitHub 仓库中。该项目旨在帮助用户快速查看每...