Dify-Plus:为Dify开发的企业内部管理后台综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上,新增了基于的管理中心,针对企业场景进行了功能优化。项目最初为企业内部使用,后来发现社区有类似需求,便...最新AI资源# AI开源项目10个月前048.9K
mcp-ui:基于MCP协议的简洁AI聊天界面综合介绍 mcp-ui 是一个开源项目,由开发者 machaojin1917939763 创建,基于 Model Context Protocol(MCP)协议打造,是一款支持 Web 和桌面环境的智...最新AI资源# AI开源项目# AI本地化聊天应用9个月前048.8K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据综合介绍 A_Share_investment_Agent 是一个基于多智能体系统的A股投资决策辅助工具。该系统旨在通过多个协作智能体来分析市场数据、计算股票内在价值、分析市场情绪以及基本面数据,从而...最新AI资源# AI开源项目# AI金融数据分析12个月前048.7K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流综合介绍 Fast-Agent 是一个由 evalstate 团队在 GitHub 上维护的开源工具,旨在帮助开发者快速定义、测试和构建多智能体工作流。它基于简单的声明式语法,支持与 MCP(Mode...最新AI资源# AI开源项目# 智能体开发框架10个月前048.7K
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI资源# AI开源项目11个月前048.7K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调综合介绍 UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG(检索增强生成)系统解决方案。该框架基于敏捷部署和模块化构建...最新AI资源# AI开源项目# 知识检索与RAG框架12个月前048.7K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架12个月前048.6K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室(HKUDS)开发的一款开源AI工具,旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造,支持多种大语言模...最新AI资源# AI开源项目# 生成深度研究报告# 论文10个月前048.6K
在cloudflare部署hugging face的免费api,支持接口转发因国内部署无法访问hugging face,所以在大佬部署方案的基础上改造成能部署到cloudflare workers。 准备工作 1、注册 cloudflare 2、注册hugging fac...最新AI资源# AI开源项目# 免费大模型API1年前048.6K
InvSR:开源图像超分辨率项目,提升图像分辨率质量综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...最新AI资源# AI图像放大与修复# AI开源项目1年前048.6K
Probly:AI分析数据并生成图表的开源表格工具综合介绍 Probly 是一个由 PragmaticMachineLearning 团队开发并在 GitHub 上开源的电子表格工具,结合了传统电子表格的功能与强大的 AI 数据分析能力。它不仅支持用...最新AI资源# AI开源项目# AI数据分析11个月前048.6K
Deep Research Web UI:支持多语言深度研究的AI助手综合介绍 Deep Research Web UI 是一个基于AI技术的开源研究助手工具,旨在帮助用户对任何主题进行深度的迭代研究。它结合了搜索引擎、网页抓取和大型语言模型的能力,通过直观的Web界面...最新AI资源# AI开源项目# 生成深度研究报告10个月前048.5K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手,旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容,并自动发送跟...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前048.5K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目,旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型(LLM...最新AI资源# AI开源项目# AI教育工具11个月前048.5K
sensitive-word:敏感词过滤工具,高效DFA算法实现综合介绍 敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供...最新AI资源# AI开源项目1年前048.5K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成综合介绍 PandasAI是一个基于Python的开源平台,旨在通过自然语言处理技术简化数据分析过程。使用户能够以对话的方式与数据库(如 SQL、CSV、pandas、polars、mongodb、n...最新AI资源# AI开源项目# AI数据分析1年前048.4K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程1年前048.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费APIWebPilot 综合介绍 Webpilot是一个免费开源的“网页助手”,它可以让你和任何网页进行自由交流,或者执行自动任务。你不需要切换网页或者复制粘贴,只需要选择文本或者输入指令,webpilot...最新AI资源# AI开放服务# AI开源项目# AI搜索工具1年前048.4K
NodeRAG:基于异构图的精准信息检索与生成工具综合介绍 NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。Nod...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前048.4K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...最新AI资源# AI开源项目12个月前048.4K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司,致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...最新AI资源# AI大模型原生对话工具# AI开源项目1年前048.3K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结综合介绍 AI2SRT是一个开源项目,利用GeminiAI大模型,为长视频一键生成解说短视频和视频总结,同时支持音视频转录字幕。该项目旨在简化视频内容创作过程,提供高效的字幕生成和翻译功能。用户可以通...最新AI资源# AI开源项目# AI音视频编辑1年前048.2K
Agent TARS:使用视觉和命令操作电脑的开源智能体综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...最新AI资源# AI开源项目# 桌面自动化智能体10个月前048.2K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架综合介绍 AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基...最新AI资源# AI开源项目# 无代码开发# 智能体开发框架7个月前048.2K
Open Codex:将自然语言转换为Shell命令的开源AI工具综合介绍 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在...最新AI资源# AI开源项目9个月前048.2K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐1年前048.2K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性综合介绍 FitDiT是一个基于扩散变换器(Diffusion Transformers)的高保真虚拟试衣系统。该项目由腾讯AI Lab开发,旨在解决传统虚拟试衣系统在展示服装细节时的局限性。FitD...最新AI资源# AI开源项目# AI换脸与换装1年前048.2K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室(Ali-Vilab)开发的一个开源项目,专注于线稿上色的自动化处理。这一工具通过深度学习技术,实现了对参考图像的精确色彩匹配,极大地提高...最新AI资源# AI图像风格控制# AI开源项目1年前048.1K
Emigo:在Emacs中使用AI完成复杂编程任务的助手综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析...最新AI资源# AI开源项目# AI编程10个月前048.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...最新AI资源# AI开源项目# 智能体应用# 视觉目标检测10个月前048K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新AI资源# AI开源项目# OCR1年前048K
olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别综合介绍 olmOCR 是由 Allen Institute for Artificial Intelligence (AI2) 的 AllenNLP 团队开发的一款开源工具,专注于将 PDF 文件转...最新AI资源# AI开源项目# 文档提取与清洗11个月前048K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗1年前048K
语析(Yuxi-Know):基于知识图谱的智能问答平台综合介绍 Yuxi-Know 是一个开源的智能问答平台,结合知识图谱和 RAG(检索增强生成)技术,帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱,使用 FastAPI 和 VueJS 构...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架9个月前048K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...最新AI资源# AI开放服务# AI开源项目# OCR1年前048K
Local Deep Research:本地运行的生成深度研究报告工具综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...最新AI资源# AI开源项目# 生成深度研究报告8个月前047.9K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Ch...最新AI资源# AI开源项目1年前047.8K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品11个月前047.8K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测10个月前047.7K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本12个月前047.7K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制综合介绍 Ruyi-Models 是一个开源项目,旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发,支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...最新AI资源# AI图像转视频# AI开源项目1年前047.7K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。综合介绍 Ant Design X是蚂蚁集团开源的一个工具包,旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板,支持与OpenAI标准兼容的模型集成,适用于智能客服、AI助手等多种应...最新AI资源# AI开源项目1年前047.6K
VoiceCraft:开源零样本语音克隆与文本转语音工具综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音...最新AI资源# AI开源项目# AI语音克隆1年前047.6K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...最新AI资源# AI开源项目# 多模态实时互动产品1年前047.6K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI资源# AI开源项目# 文档提取与清洗1年前047.5K
code2prompt:将代码库转换为大模型可理解的prompt文件综合介绍 code2prompt 是一个开源的命令行工具,由开发者 Mufeed VH 创建并托管在 GitHub 上,旨在帮助用户将整个代码库快速转换为适合大语言模型(LLM)的提示(prompt...最新AI资源# AI开源项目11个月前047.5K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务综合介绍 Basic Memory 是一个通过与AI助手(如Claude)对话来构建知识图谱的工具。它由 Basic Machines 公司开发,核心特点是把对话内容保存为 Markdown 文件,存...最新AI资源# AI开源项目# MCP服务# 知识图谱10个月前047.5K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务综合介绍 Flow是一个轻量级的任务引擎,专为构建AI代理而设计,强调简洁性和灵活性。与传统的基于节点和边的工作流不同,Flow采用动态任务队列系统,支持并行执行、动态调度和智能依赖管理。其核心理念是...最新AI资源# AI开源项目# 低代码工作流1年前047.5K
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前047.5K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译11个月前047.4K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天综合介绍 OpenAOE 是一个开源的大模型群聊框架,旨在解决当前市场上缺乏多模型并行响应的聊天框架的问题。通过 OpenAOE,用户可以同时与多个大语言模型(LLM)进行对话,获取并行输出。该框架支...最新AI资源# AI开源项目# AI集成多模型对话平台11个月前047.4K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前047.4K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台,专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型,包括基于扩散和自回归的世界...最新AI资源# AI开放服务# AI开源项目1年前047.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音(TTS)模型库,旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格(如性别、音调、说话风...最新AI资源# AI开源项目# AI文本转语音11个月前047.3K
Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...最新AI资源# AI开源项目# AI生活效率助手# 大模型微调10个月前047.3K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目1年前047.2K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架10个月前047.2K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目1年前047.2K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI资源# AI开源项目# AI数字人1年前047.1K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道综合介绍 Yutu 是一个功能强大的开源命令行工具,专为 YouTube 用户设计,托管于 GitHub,由 eat-pray-ai 团队开发。它通过终端操作实现对 YouTube 视频、播放列表、频...最新AI资源# AI开源项目11个月前047.1K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体1年前047K
AiPy:自动化运行Python代码完成数据分析任务综合介绍 AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Pytho...最新AI资源# AI开源项目# 桌面自动化智能体9个月前047K
Neural4D:生成高分辨率3D建模数字资产的AI平台综合介绍 Neural4D 是一个基于人工智能的创新平台,专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发,依托世界领先的端到端3D生成大模型技...最新AI资源# AI开源项目# AI文本与图片转3D11个月前047K
Langui:开源的AI用户界面组件库综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...最新AI资源# AI开源项目# AI页面设计12个月前047K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆1年前046.9K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片...最新AI资源# AI开源项目# 文档提取与清洗10个月前046.9K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...最新AI资源# AI开源项目# AI自部署图像生成工具1年前046.9K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目9个月前046.9K
Quadratic:集成AI对话和代码执行的在线数据分析表格综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic...最新AI资源# AI开源项目# AI数据分析11个月前046.9K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架12个月前046.8K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。项目托管在GitHub上...最新AI资源# AI开源项目# AI教育工具11个月前046.8K
Paper2Code:将机器学习论文自动转化为可运行代码综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...最新AI资源# AI开源项目# 智能体应用8个月前046.7K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言综合介绍 askrepo 是一个基于LLM(大语言模型)的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容,并将其发送到Google Gemini API,根据指定的提示提供问题的答案...最新AI资源# AI开源项目1年前046.7K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用10个月前046.7K
Oliva:语音控制的多智能体产品搜索助手综合介绍 Oliva 是一个开源的多智能体助手工具,由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作,帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...最新AI资源# AI开源项目# 智能体应用# 知识检索与RAG框架10个月前046.7K
基于Qdrant向量搜索引擎构建的MCP服务综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...最新AI资源# AI开源项目# MCP服务10个月前046.7K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目10个月前046.6K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI资源# AI开源项目# AI教育工具# AI文本转视频1年前046.6K
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...最新AI资源# AI开源项目# 大模型微调10个月前046.6K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体1年前046.6K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...最新AI资源# AI开源项目# 文档提取与清洗1年前046.5K
Austen:分析书籍角色关系并生成图表的AI工具综合介绍 Austen 是一个开源的 AI 工具,它使用 Angular 框架和 Analogjs 初始化,结合 Mermaidjs 技术生成图表,帮助用户分析书籍中的角色关系。用户可以输入 Open...最新AI资源# AI开源项目# AI白板与信息图9个月前046.5K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol(模型上下文协议)的开源工具,托管于 GitHub,由开发者 Zach Caceres ...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗10个月前046.4K
SmartRead:自动标注技术PDF文档并提供相关引用源综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主...最新AI资源# AI写作# AI开源项目# AI教育工具10个月前046.4K
Napkins.dev:基于Llama4上传线框图生成前端代码综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...最新AI资源# AI开源项目# AI页面设计9个月前046.4K
PicMenu:文字菜单转换为美观的图文菜单综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型...最新AI资源# AI开源项目1年前046.4K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端综合介绍 Copilot后端代理服务是一个开源项目,旨在通过借助其他FIM模型(如DeepSeek)来管理GitHub Copilot插件服务端,同时支持多人共享官方账号。该服务支持多种IDE,包括V...最新AI资源# AI开放服务# AI开源项目1年前046.4K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。综合介绍 RAGLite 是一个用于检索增强生成(RAG)的 Python 工具包,支持 PostgreSQL 或 SQLite 数据库。它提供了灵活的配置选项,允许用户选择不同的语言模型和重排序器...最新AI资源# AI开源项目# 知识检索与RAG框架1年前046.4K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...最新AI资源# AI开源项目1年前046.4K
LocalGPT:在本地设备上与多文档对话,确保数据隐私综合介绍 LocalGPT是一个开源项目,旨在让用户在本地设备上与文档进行对话,确保数据隐私。通过使用各种开源模型,LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平...最新AI资源# AI开源项目# 知识检索与RAG框架1年前046.3K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR9个月前046.3K
BuffGPT:企业级生成式AI应用低代码开发平台综合介绍 BuffGPT 是一个基于大语言模型(LLM)的开源AI应用开发平台,提供数据处理、模型调用、RAG检索和可视化工作流编排等开箱即用功能,帮助用户轻松构建和运营生成式AI应用。平台支持私有化...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架10个月前046.3K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用1年前046.3K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象综合介绍 OASIS(Open Agent Social Interaction Simulations)是一个开源的社交媒体模拟器,能够模拟多达一百万用户的行为。该平台结合了大型语言模型和基于规则的...最新AI资源# AI开源项目# 智能体应用10个月前046.2K
csm-mlx:苹果设备专用的 csm 语音生成模型综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用...最新AI资源# AI开源项目# AI文本转语音10个月前046.2K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程1年前046.1K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前046.1K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前046.1K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告10个月前046K