DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)综合介绍 DualPipe 是由 DeepSeek-AI 团队开发的一项开源技术,专注于提升大规模 AI 模型训练的效率。它是一个创新的双向流水线并行算法,主要用于在 DeepSeek-V3 和 R1...最新AI资源# AI开源项目6个月前02.4K
Grok-Mirror:一键部署可盈利的Grok镜像站综合介绍 Grok-Mirror是一个基于 无服务器快速部署Grok3国内镜像站 构建的可经营的Grok镜像站。它让用户可以通过Docker一键部署本地Grok服务站。Grok是xAI公司推出的人工智...最新AI资源# AI副业赚钱项目# AI开源项目5个月前02.4K
无服务器快速部署Grok3国内镜像站综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型,而 ...最新AI资源# AI开源项目5个月前02.4K
AI Logo:AI快速生成定制化品牌Logo综合介绍 AI Logo 是一个开源的AI应用项目,目标是帮助用户通过人工智能快速生成个性化的品牌标志。它结合了强大的AI技术,比如Stable Diffusion和DeepAI,让用户输入简单的品牌...最新AI资源# AI图像风格控制# AI开源项目5个月前02.4K
Sidekick CLI:一个开源的 Claude Code 替代工具综合介绍 Sidekick CLI 是一个开源的命令行工具,旨在通过 AI 辅助简化开发者的项目开发和部署流程。它受到 Claude Code、Copilot 和 Cursor 的启发,提供类似的功能...最新AI资源# AI开源项目# AI编程4个月前02.4K
茴香豆:基于LLM(大型语言模型) 的群聊助手综合介绍 HuixiangDou 是一个基于大型语言模型(LLM)的群聊助手,旨在通过三阶段的预处理、拒绝和响应流程来应对群聊场景。它能够在不造成信息泛滥的情况下回答用户问题。该项目提供了完整的Web...最新AI资源# AI开源项目6个月前02.4K
闲鱼卖家全天自动值守的AI客服机器人综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统,由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守,帮助闲鱼卖家回复...最新AI资源# AI副业赚钱项目# AI客服机器人# AI开源项目5个月前02.4K
CogView4:生成中英双语高清图片的开源文生图模型综合介绍 CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非...最新AI资源# AI开源项目# AI自部署图像生成工具5个月前02.4K
Dia:生成超现实多人对话的文本转语音模型综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表...最新AI资源# AI开源项目# AI文本转语音4个月前02.4K
TxAgent:帮医生分析药物作用和治疗方案的AI工具综合介绍 TxAgent 是哈佛大学医学与科学人工智能团队(MIMS)开发的一款开源AI工具,旨在帮助医生分析药物相互作用并制定个性化治疗方案。它通过多步骤推理和实时检索生物医学知识,结合患者的具体情...最新AI资源# AI开源项目# 智能体应用5个月前02.4K
Trackers:用于视频对象跟踪的开源工具库综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...最新AI资源# AI开源项目# 视觉目标检测3个月前02.4K
OmniSQL:将自然语言转化为高质量SQL查询的模型综合介绍 OmniSQL 是一个开源项目,由 RUCKBReasoning 团队开发,托管在 GitHub 上。它的核心功能是将用户输入的自然语言问题转化为高质量的 SQL 查询语句,帮助用户轻松与数...最新AI资源# AI开源项目# AI数据分析4个月前02.4K
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI资源# AI开源项目# MCP服务5个月前02.4K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型综合介绍 Omnitool.ai 是一个开源的“AI实验室”,旨在为学习者、爱好者和对当前AI创新感兴趣的任何人提供一个可扩展的浏览器桌面环境。它允许用户通过一个统一的界面与来自OpenAI、repl...最新AI资源# AI开源项目6个月前02.4K
为Next.js应用程序添加RAG驱动的在线聊天工具综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件,旨在提供基于RAG(检索增强生成)技术的AI聊天界面。该组件结合了Upstash V...最新AI资源# AI开源项目6个月前02.4K
Memobase:为AI应用提供基于用户画像的长期记忆方案综合介绍 Memobase 是一个基于用户画像的记忆系统,旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手,Memobase 都能帮助您的AI记住、理解并随着用...最新AI资源# AI开源项目6个月前02.4K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具综合介绍 OpenSearch-SQL 是一个开源项目,它是一个强大的 Text-to-SQL 工具,可以把用户的自然语言描述转化为 SQL 查询语句,帮助不熟悉数据库的人轻松获取数据。这个项目由 O...最新AI资源# AI开源项目# AI数据分析5个月前02.4K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具,旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...最新AI资源# AI开源项目5个月前02.4K
RealtimeVoiceChat:低延迟与AI进行自然口语对话综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...最新AI资源# AI开源项目# 多模态实时互动产品3个月前02.4K
Oliva:语音控制的多智能体产品搜索助手综合介绍 Oliva 是一个开源的多智能体助手工具,由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作,帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...最新AI资源# AI开源项目# 智能体应用# 知识检索与RAG框架5个月前02.4K
CodeWeaver:将代码结构和内容自动生成Markdown文档综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具...最新AI资源# AI开源项目# 文档提取与清洗6个月前02.4K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作综合介绍 OmniParser是一个由微软开发的工具,旨在解析用户界面截图,将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...最新AI资源# AI开源项目6个月前02.4K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测4个月前02.3K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型综合介绍 Skywork-R1V 是由 SkyworkAI(昆仑万维) 团队开发的一款开源多模态推理模型,发布于 GitHub。它能同时处理图像和文字,进行多步骤逻辑推理,特别擅长分析复杂图像问题。这...最新AI资源# AI开源项目5个月前02.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目,旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型(LLM...最新AI资源# AI开源项目# AI教育工具6个月前02.3K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。综合介绍 Inbox Zero 是一个开源的邮件管理应用,旨在通过 AI 助手帮助用户快速实现收件箱零邮件。该应用提供了多种功能,包括自动回复、归档、标签和转发邮件,管理和退订新闻通讯,阻止冷邮件,跟...最新AI资源# AI开源项目# AI生活效率助手8个月前02.3K
Step1X-Edit:自然语言指令编辑图像的开源工具综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然...最新AI资源# AI图像编辑# AI开源项目3个月前02.3K
Plandex:支持超长上下文的开源AI编码助手综合介绍 Plandex 是一个开源的终端 AI 编码助手,专为大型复杂软件项目设计。它能规划和执行多步骤任务,处理高达 200 万 token 的上下文,支持 30 多种编程语言。Plandex 提...最新AI资源# AI开源项目# AI编程4个月前02.3K
ACI.DEV:通过MCP服务器为AI智能体集成600+工具综合介绍 ACI.dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、S...最新AI资源# AI开源项目# MCP服务3个月前02.3K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)综合介绍 3FS(Fire-Flyer File System)是由DeepSeek团队开发的一款开源并行文件系统,专为现代SSD和RDMA网络设计,旨在大幅提升数据访问效率。它在180节点集群中实现...最新AI资源# AI开源项目6个月前02.3K
CortexON:开源多代理AI工具,支持复杂任务自动化综合介绍 CortexON 是一个开源的多代理 AI 系统,托管在 GitHub 上,网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...最新AI资源# AI开源项目# 智能体应用5个月前02.3K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架综合介绍 SkyPilot 是一个由加州伯克利大学 Sky Computing Lab 发起的开源框架,旨在帮助用户在任何云端基础设施上高效运行 AI 和批处理任务。它支持超过 14 种云服务(包括 ...最新AI资源# AI开源项目6个月前02.3K
Arrakis:为AI智能体提供安全沙盒环境的开源工具综合介绍 Arrakis 是一个专为 AI 智能体设计,提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发,托管在 GitHub 上,使用 AGPL v3 许可证。Arrak...最新AI资源# AI开源项目4个月前02.3K
Paper to Podcast:把学术论文转换为多人对话播客综合介绍 Paper to Podcast 是一个开源工具,专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术,将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话,让复杂的...最新AI资源# AI开源项目# AI文本转语音4个月前02.3K
Together Open Deep Research:生成带索引的深度研究报告综合介绍 Open Deep Research 是一个由 Together AI 团队开发并开源的深度研究工具,托管在 GitHub 上。它通过多代理人工智能工作流,模拟人类研究过程,生成详细的研究报...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.3K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具综合介绍 Hunyuan3D-2 是腾讯开发的一个开源项目,旨在通过文字或图像生成高分辨率的3D模型。它由两个核心部分组成:形状生成模型(Hunyuan3D-DiT)和纹理生成模型(Hunyuan3D...最新AI资源# AI开源项目# AI文本与图片转3D5个月前02.3K
One-Prompt-One-Story:文本提示生成角色身份一致的图像综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具,旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...最新AI资源# AI图像风格控制# AI开源项目6个月前02.3K
检测MCP服务安全风险的开源工具综合介绍 mcp-is-dangerous 是 Shaojie Jiang 在 GitHub 上开发的一个开源工具。它通过简单的 Python 代码,帮助用户检测 MCP(Model Context ...最新AI资源# AI开源项目# MCP服务5个月前02.3K
MegaPairs:BGE新推出的多模态向量嵌入模型综合介绍 MegaPairs 是 VectorSpaceLab 团队在 GitHub 上开源的项目,通过大规模数据合成技术生成多模态嵌入模型,用于图像-文本到图像的检索任务。项目基于超过2600万个异...最新AI资源# AI开源项目5个月前02.3K
Mad Professor:辅助阅读和分析学术论文的AI工具综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...最新AI资源# AI开源项目# AI教育工具3个月前02.3K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架综合介绍 PrimisAI Nexus 是一个轻量级的开源Python框架,托管于GitHub,由PrimisAI团队开发,旨在通过大语言模型(LLM)帮助用户构建和管理可扩展的AI多智能体系统,实现...最新AI资源# AI开源项目# 智能体开发框架5个月前02.3K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流综合介绍 Fast-Agent 是一个由 evalstate 团队在 GitHub 上维护的开源工具,旨在帮助开发者快速定义、测试和构建多智能体工作流。它基于简单的声明式语法,支持与 MCP(Mode...最新AI资源# AI开源项目# 智能体开发框架5个月前02.3K
Onyx:连接企业知识库的智能AI聊天平台综合介绍 Onyx(原名Danswer)是一个开源的AI聊天平台,由onyx-dot-app团队开发,旨在帮助企业整合和管理文档、应用及员工数据。它提供丰富的聊天功能,支持连接任意大语言模型(LLM...最新AI资源# AI开源项目# 知识检索与RAG框架5个月前02.3K
Zev:用自然语言快速查询终端命令的CLI工具综合介绍 Zev 是一个简单易用的命令行界面(CLI)工具,帮助用户通过自然语言快速查询和生成终端命令。用户无需记住复杂的命令语法,只需用日常语言描述需求,Zev 就能生成对应的终端命令。基于 Ope...最新AI资源# AI开源项目4个月前02.3K
CRCT:递归分解大型代码任务并持久保存项目状态综合介绍 Cline Recursive Chain-of-Thought System(简称CRCT)是一个开源框架,专为在VS Code中管理大型代码项目而设计。当前版本为v7.0,它通过递归方式...最新AI资源# AI开源项目5个月前02.3K
Text2Voice:基于硅基流动API的文本转语音图形界面综合介绍 Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让...最新AI资源# AI开源项目# AI文本转语音4个月前02.3K
Airweave:让应用程序快速集成知识库,实现智能搜索综合介绍 Airweave 是一个开源工具,旨在通过同步用户的应用数据、API、数据库和网站到图谱和向量数据库,使任何应用程序变得可搜索。Airweave 简化了数据可搜索化的过程,无论是结构化数据还...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.3K
AgentIQ:灵活连接和管理AI智能体的开源工具综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具,旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作,连接企业数据和工具,像调用函数一样构建工作流。这个工具的最大...最新AI资源# AI开源项目# 智能体开发框架5个月前02.3K
Ollama+LangGraph 本地部署学术研究报告生成助手综合介绍 Ollama Deep Researcher 是一个完全本地运行的网页研究和报告生成助手,由 LangChain 团队开发。它通过 Ollama 托管的任意大型语言模型(LLM),让用户输入...最新AI资源# AI开源项目# AI教育工具5个月前02.3K
DeepResearcher:基于强化学习驱动AI研究复杂问题综合介绍 DeepResearcher 是由上海交通大学 GAIR-NLP 团队开发的开源项目。它是一个基于大型语言模型(LLM)的智能研究工具,通过强化学习(RL)在真实网络环境中进行端到端训练。项...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.3K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)综合介绍 文颜(WenYan)是一个专为Markdown文章排版美化而设计的工具,支持将编辑好的Markdown文章转换成适配微信公众号、知乎、今日头条等多个平台的格式。用户可以通过一键复制,将文章直...最新AI资源# AI开源项目7个月前02.3K
Long-VITA:支持超长上下文输出的视觉语言模型综合介绍 Long-VITA 是由 VITA-MLLM 团队开发的一款开源多模态大模型,专注于处理超长上下文的视觉和语言任务。它能够同时分析图像、视频和文本,支持高达 100 万 token 的输入...最新AI资源# AI开源项目5个月前02.3K
HumanOmni:分析人类视频情感和动作的多模态大模型综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 2...最新AI资源# AI开源项目# 视觉目标检测5个月前02.3K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.3K
OpenDeepSearch:支持智能推理的开源搜索工具综合介绍 OpenDeepSearch 是一个开源的搜索工具,由 sentient-agi 团队开发。它结合了大型语言模型(LLM)和智能推理代理,让用户可以用简单的方式搜索网页信息并获取准确答案。这...最新AI资源# AI开源项目# AI搜索工具5个月前02.3K
MoshiVis:实时语音对话和图像理解的开源模型综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...最新AI资源# AI开源项目# 多模态实时互动产品5个月前02.3K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告综合介绍 GPT Researcher 是一个基于大型语言模型(LLM)的自主代理工具,旨在进行本地和网络研究,并生成详细的研究报告。该工具通过并行化代理工作,提供稳定的性能和更快的速度,确保信息的准...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.3K
OpenAI.fm:展示OpenAI语音API的交互式演示工具综合介绍 openai-fm 是一个开源项目,托管在 GitHub 上,专门用于展示 OpenAI 文本转语音(Text-to-Speech, TTS)API 的功能。这个项目通过一个交互式网页应用...最新AI资源# AI开源项目4个月前02.3K
Shadowfetch:Cloudflare Workers 匿名代理大模型API综合介绍 Shadowfetch 是一个专为 Cloudflare Workers 设计的轻量级开源工具,由开发者 tysak 在 GitHub 上维护,采用 AGPL v3 许可证发布。它通过原生 ...最新AI资源# AI开源项目5个月前02.3K
AiryLark:支持多格式文档智能翻译的开源工具综合介绍 AiryLark 是一个开源的文档处理与翻译工具,托管在 GitHub 上,由开发者 wizd 基于 Next.js 框架打造。它支持多种文件格式(如 PDF、Word、TXT、Markdo...最新AI资源# AI开源项目# AI翻译4个月前02.3K
FreeAI:基于Pollinations封装的的免费AI工具综合介绍 FreeAI 是一个基于 Pollinations.AI API 的开源 AI 应用平台,提供免费且无限制的 AI 聊天助手、图像生成和语音合成服务。这个项目由开发者 Azad-sl 在 G...最新AI资源# AI开源项目# AI集成多模型对话平台4个月前02.3K
Deep Searcher:企业私有文档高效检索与智能问答综合介绍 Deep Searcher 是一个结合强大大语言模型(如 DeepSeek 和 OpenAI)和向量数据库(如 Milvus)的工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.3K
TestDriver:使用AI自动测试软件的智能工具综合介绍 TestDriver 是一个利用人工智能技术帮助开发者测试软件的网站。它通过模拟人类操作,比如点击鼠标、输入文字,来自动完成软件的测试任务。网站的核心是“计算机使用AI代理”,能像真人一样操...最新AI资源# AI开源项目4个月前02.3K
Moffee:将Markdown转为PPT幻灯片综合介绍 Moffee 是一个开源工具,它能把 Markdown 文件快速变成专业的幻灯片,简单又高效。用户只需写好 Markdown 内容,Moffee 就能自动处理布局、分页和样式,省去手动排版的...最新AI资源# AI开源项目# AI生成演示文稿/PPT4个月前02.3K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台,旨在每天自动抓取 Hacker News 上的热门文章,并通过 AI 生成中文总结和播报内容。该项目由 ccbikai ...最新AI资源# AI开源项目# AI文本与音频/视频总结工具6个月前02.3K
GAG:利用大模型模拟人类行为生成社交关系图谱综合介绍 GraphAgent 是一个开源框架,托管在 GitHub 上,由 Ji-Cather 开发。它利用大语言模型(LLM)模拟人类行为,生成动态的、带文本属性的社交图。这个工具适用于在线社交媒...最新AI资源# AI开源项目# 知识图谱5个月前02.3K
VOP:提取复杂图表与数学公式的OCR工具综合介绍 Versatile OCR Program 是一个开源的光学字符识别(OCR)工具,专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图,并生...最新AI资源# AI开源项目# OCR# 文档提取与清洗4个月前02.3K
Story-Flicks:输入主题自动生成儿童短故事视频综合介绍 Story-Flicks 是一个开源的AI工具,专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题,系统会通过大语言模型生成故事内容,并结合AI生成的图像、音频和字幕,输出完整的视...最新AI资源# AI开源项目# AI视频生成工具5个月前02.3K
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI资源# AI开源项目# AI教育工具# 论文5个月前02.3K
SmolDocling:小体积高效处理文档的视觉语言模型综合介绍 SmolDocling 是由 ds4sd 团队与 IBM 合作开发的一个视觉语言模型(VLM),基于 SmolVLM-256M 打造,托管在 Hugging Face 平台。它体积小,只有 ...最新AI资源# AI开源项目# OCR# 文档提取与清洗5个月前02.3K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型综合介绍 InternLM-XComposer 是由 InternLM 团队开发的一个开源图文多模态大模型项目,托管于 GitHub。它基于 InternLM 语言模型,能够处理文本、图像、视频等多模...最新AI资源# AI开源项目6个月前02.3K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...最新AI资源# AI开源项目4个月前02.2K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序,由开发者 speedTD 创建,托管在 GitHub 上。它利用 Google Gemini 人工智能技术,让...最新AI资源# AI开源项目# AI换脸与换装5个月前02.2K
Coding-Tutor:提供个性化编程指导的智能教学助手综合介绍 Coding-Tutor 是一个托管在 GitHub 上的开源项目,由开发者 iwangjian 创建,旨在为学习者提供个性化的编程教学体验。它通过对话式人工智能技术,根据用户的知识背景和学...最新AI资源# AI开源项目# AI教育工具6个月前02.2K
par_scrape:智能提取网页数据的爬虫工具综合介绍 par_scrape 是一个基于 Python 的开源网页爬虫工具,由开发者 Paul Robello 在 GitHub 上推出,旨在帮助用户从网页中智能提取数据。它整合了 Selenium...最新AI资源# AI开源项目# 文档提取与清洗6个月前02.2K
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI资源# AI开源项目# OCR4个月前02.2K
Abogen:将多种文本格式转换为有声读物的工具综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...最新AI资源# AI开源项目# AI语音转文本3个月前02.2K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目4个月前02.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI资源# AI开源项目# AI数字人4个月前02.2K
OneLine:生成热点事件时间轴的AI工具综合介绍 OneLine 是一个开源的热点事件时间轴生成工具,托管在 GitHub,由用户 chengtx809 开发。它通过用户输入的关键词,快速生成事件的时间轴,展示事件的时间、标题、描述和相关人...最新AI资源# AI开源项目# AI搜索工具4个月前02.2K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息综合介绍 公司研究工具(Company Researcher)是一个免费且开源的工具,旨在帮助用户快速全面地了解任何公司。只需输入公司的网址,该工具便会从网络上收集全面的信息,呈现关于该组织、其产品...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.2K
InfiniteYou:保留人脸特征的照片生成与编辑工具综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生...最新AI资源# AI图像风格控制# AI开源项目5个月前02.2K
Orchestra:构建智能AI团队,让多智能体协作开发更简单高效综合介绍 Orchestra是一个创新的轻量级Python框架,专注于构建基于大语言模型(LLM)的多智能体协作系统。它采用独特的智能体编排方法,让多个AI智能体能够像交响乐团一样和谐配合工作。通过模...最新AI资源# AI开源项目# 智能体开发框架7个月前02.2K
MiniMind-V:1小时训练26M参数视觉语言模型综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...最新AI资源# AI开源项目# 大模型微调4个月前02.2K
Dify-Plus:为Dify开发的企业内部管理后台综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上,新增了基于的管理中心,针对企业场景进行了功能优化。项目最初为企业内部使用,后来发现社区有类似需求,便...最新AI资源# AI开源项目5个月前02.2K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划综合介绍 OpenHealthForAll 是一个开源项目,旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术,OpenHealthForAll 提供了一个本地运行的健康助手,帮助用户更好地管理...最新AI资源# AI开源项目# AI生活效率助手6个月前02.2K
Dolphin:面向亚洲语言识别与语音转文本模型综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型,专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言,以及 22 种中国方言...最新AI资源# AI开源项目# AI语音转文本4个月前02.2K
Thera:任意尺寸图像放大、去锯齿的开源工具综合介绍 Thera 是一个开源的图像超分辨率工具,由苏黎世联邦理工学院(ETH Zurich)和苏黎世大学的团队开发。它能将低分辨率图像放大到任意尺度,比如 2 倍、3.14 倍甚至非整数倍,并且放...最新AI资源# AI图像放大与修复# AI开源项目4个月前02.2K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架综合介绍 Chitu 是一个由清华大学 PACMAN 团队开发的开源推理框架,全名叫“赤兔”,专门用来跑大语言模型。它主打高效、灵活和实用,能让企业在不同设备上快速部署大模型。Chitu 支持多种硬件...最新AI资源# AI开源项目5个月前02.2K
基于Workers AI免费将多种文件转为Markdown格式综合介绍 serverless-markdown-convertor 是一个免费的开源工具,基于 Cloudflare Worker 和 Workers AI 开发,能将多种文件转换为 Markdow...最新AI资源# AI开源项目# 文档提取与清洗4个月前02.2K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求...最新AI资源# AI图像转视频# AI开源项目6个月前02.2K
Claude生成深度研究报告的MCP服务综合介绍 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度...最新AI资源# AI开源项目# MCP服务# 生成深度研究报告3个月前02.2K
GraphGen:利用知识图谱生成合成数据微调语言模型综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...最新AI资源# AI开源项目# 大模型微调# 知识图谱3个月前02.2K
LitServe:快速部署企业级通用AI模型推理服务综合介绍 LitServe 是 Lightning AI 推出的一款开源 AI 模型服务引擎,基于 FastAPI 构建,专注于快速部署通用 AI 模型的推理服务。它支持从大型语言模型(LLM)、视觉...最新AI资源# AI开源项目# 本地部署开源大模型工具5个月前02.2K
UIGEN-T1-Qwen-7b:生成HTML和CSS UI组件的专用模型综合介绍 UIGEN-T1 是一个拥有 70 亿参数的 Transformer 模型,它基于 Qwen2.5-Coder-7B-Instruct 进行微调,专为基于推理的 UI 生成而设计。它利用复杂...最新AI资源# AI开源项目6个月前02.2K
GenXD:生成任意3D和4D场景视频的开源框架综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...最新AI资源# AI开源项目# AI文本与图片转3D4个月前02.2K
AgentGPT:创建并运行自动化AI智能体的开源项目综合介绍 AgentGPT 是一个由 Reworkd 团队开发的开源项目,托管在 GitHub 上,旨在让用户通过浏览器自主创建、配置和部署 AI 智能体。用户只需设定一个目标,AgentGPT 就能...最新AI资源# AI开源项目# 智能体开发框架5个月前02.2K
Deepdive Llama3 From Scratch:教你从零开始实现Llama3模型综合介绍 Deepdive Llama3 From Scratch 是一个托管在 GitHub 上的开源项目,专注于一步步解析和实现 Llama3 模型的推理过程。它基于 naklecha/llama...最新AI资源# AI开源项目6个月前02.1K
Xata Agent:监控和优化PostgreSQL数据库的AI助手综合介绍 Xata Agent 是一个开源的AI工具,专门为PostgreSQL数据库设计。它能自动监控数据库运行状态,发现性能问题或故障的根本原因,并给出修复建议。开发团队xAI将其定位为一个类似...最新AI资源# AI开源项目# AI数据分析5个月前02.1K