
dsRAG:用于处理非结构化数据和复杂查询的检索引擎
综合介绍 dsRAG是一款高性能检索引擎,专门用于处理非结构化数据的复杂查询。它在处理密集文本(如财务报告、法律文件和学术论文)中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能:语义分段、...
综合介绍 dsRAG是一款高性能检索引擎,专门用于处理非结构化数据的复杂查询。它在处理密集文本(如财务报告、法律文件和学术论文)中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能:语义分段、...
综合介绍 SongGen 是一个开源的单阶段自回归Transformer模型,专为文本到歌曲的生成任务设计。该模型能够从文本输入生成包含人声和伴奏的歌曲。SongGen 提供了对多种音乐属性的细粒度控制,包括歌词、乐器描述、...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Graphiti是由 getzep 开发的一款用于构建和查询动态、时间感知的知识图谱的工具。它能够表示实体之间复杂且不断变化的关系,并通过时间、全文、语义和图算法等多种方法进行查询。Graphiti可以同时处理非...
综合介绍 Memobase 是一个基于用户画像的记忆系统,旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手,Memobase 都能帮助您的AI记住、理解并随着用户的互动不断进化。通...
综合介绍 agent-twitter-client是一个无需Twitter API密钥即可使用的Twitter客户端。该项目基于@the-convocation/twitter-scraper进行了修改,增加了发送推文和转推的功能。它可以在浏览器和服务器上运行,适用于...
综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型数据,如逻辑推理...
综合介绍 MoBA(Mixture of Block Attention)是由MoonshotAI开发的一种创新注意力机制,专为长上下文处理的大语言模型(LLMs)设计。MoBA通过将全上下文划分为多个块,每个查询token学习关注最相关的KV块,从而...
综合介绍 Base Chat 是一个多租户聊天机器人,使用 Ragie Connect 连接并与组织的知识库进行对话。该项目是 Ragie 多项功能的参考应用,基于 Next.js 构建,支持 Google 认证。Base Chat 旨在帮助用户通过聊天机...
综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端,旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话,集成了ChatGPT、Gemini、Claude、文心一言、通义千问和讯飞星火等多种AI产品。AIBot...
综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI能够显著减少模型训练和推理...
综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型,旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中,显著提升了医疗图像处理的...
综合介绍 MatAnyone 是一个专注于视频抠像的开源项目,由新加坡南洋理工大学 S-Lab 的研究团队开发并在 GitHub 上发布。它通过一致性记忆传播技术,为用户提供稳定高效的视频处理能力,尤其擅长处理复杂背景下的...
综合介绍 HiveChat 是一个为中小型团队设计的 AI 聊天机器人,允许管理员一次性配置多种 AI 模型(如 Deepseek、OpenAI、Claude 和 Gemini),方便团队成员使用。它的特色功能包括 LaTeX 和 Markdown 渲染、DeepS...
综合介绍 Omnitool.ai 是一个开源的“AI实验室”,旨在为学习者、爱好者和对当前AI创新感兴趣的任何人提供一个可扩展的浏览器桌面环境。它允许用户通过一个统一的界面与来自OpenAI、replicate.com、Stable Diffusio...
综合介绍 Step-Video-T2V是由StepFun AI(阶跃星辰)推出的一款先进的文本到视频转换模型。该模型拥有30亿参数,能够生成长达204帧的视频。通过深度压缩变分自编码器(VAE),模型实现了16x16的空间压缩和8x的时...
综合介绍 OmniParser是一个由微软开发的工具,旨在解析用户界面截图,将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支持多种大型语言模型,还能...
综合介绍 genspark2api 是一个开源的 API 服务工具,托管在 GitHub 上,由开发者 deanxv 创建。它提供了一个支持多模型对话、文生图和文生视频的接口服务,用户可以通过 Docker 快速部署在本地或服务器上。这个工...
综合介绍 DragAnything 是一个开源项目,旨在通过实体表示实现任意对象的运动控制。该项目由 Showlab 团队开发,并已被 ECCV 2024 接收。DragAnything 提供了一种用户友好的交互方式,用户只需绘制一条轨迹线即可...
综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川话)、可...