InsightExpress:生成AI驱动的研究报告并通过电子邮件发送综合介绍 InsightExpress 是一个基于 Next.js 的应用程序,能够根据用户提供的主题生成 AI 驱动的研究报告,并通过电子邮件发送给用户。该应用程序利用 Langflow 的 AI ...最新AI资源# AI开源项目# 生成深度研究报告7个月前022.6K
Vision Agent:解决多种视觉目标检测任务的视觉智能体综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...最新AI资源# AI开源项目# 视觉目标检测8个月前022.6K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词综合介绍 DeepSeek Engineer是一款基于DeepSeek API开发的强大编程助手工具,它能够通过直观的命令行界面与用户进行交互,协助完成各种软件开发任务。该工具将大型语言模型的能力与实...最新AI资源# AI开源项目8个月前022.5K
EasyControl:将人像转为吉卜力风格图像的免费工具综合介绍 EasyControl 是一个开源项目,项目基于扩散变换器(DiT)架构,提供高效、灵活的图像生成控制。其中,Ghibli Control LoRA 是其特色功能之一,通过仅用 100 张亚...最新AI资源# AI图像风格控制# AI开源项目6个月前022.5K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目综合介绍 Llama Tutor 是一个基于 Llama 3.1 构建的开源 AI 个人助教项目,旨在为用户提供个性化的学习体验。通过整合多种技术栈,如 Together AI、Next.js 和 T...最新AI资源# AI开源项目# AI教育工具11个月前022.5K
LangManus:支持多智能体协作的开源AI自动化框架综合介绍 LangManus 是一个开源的 AI 自动化框架,托管在 GitHub 上。它由一群前同事在业余时间开发,属于学术驱动项目,目标是结合语言模型和专用工具,完成网页搜索、数据爬取和代码执行等...最新AI资源# AI开源项目# 智能体应用7个月前022.5K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案综合介绍 Podcastfy 是一个开源的 Python 软件包,利用生成式人工智能(GenAI)技术,将网页内容、PDF 文件、文本、图像、youtube 视频等多种来源的内容转换为引人入胜的多语言...最新AI资源# AI开源项目# AI文本转语音12个月前022.5K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Pr...最新AI资源# AI开源项目# 大模型微调8个月前022.5K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫...最新AI资源# AI开源项目11个月前022.5K
PDF to Podcast:将PDF转换为播客的实用工具综合介绍 受 Notebook LM 的播客生成特性和最近的 Open Notebook LM 开源实现的启发。在本食谱中,我们将实现一个关于如何构建 PDF 到播客管道的详细步骤。 给定任何 PDF...最新AI资源# AI开源项目12个月前022.5K
CogView4:生成中英双语高清图片的开源文生图模型综合介绍 CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非...最新AI资源# AI开源项目# AI自部署图像生成工具7个月前022.5K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码综合介绍 Micro-Agent是由Builder.io开发的一款开源AI编码助手,旨在为开发者提供自动生成和测试代码的功能。它通过理解自然语言描述生成测试用例,并迭代代码直到所有测试通过,从而减少开...最新AI资源# AI开源项目# AI编程9个月前022.5K
GraphRAG Visualizer:可视化和探索Microsoft GraphRAG工件的工具综合介绍 GraphRAG Visualizer 是一个基于网页的工具,旨在帮助用户可视化和探索来自 Microsoft GraphRAG 的工件。通过上传由 GraphRAG 索引管道生成的 Par...最新AI资源# AI开源项目# 知识图谱10个月前022.5K
SmartRead:自动标注技术PDF文档并提供相关引用源综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主...最新AI资源# AI写作# AI开源项目# AI教育工具7个月前022.4K
Story-Flicks:输入主题自动生成儿童短故事视频综合介绍 Story-Flicks 是一个开源的AI工具,专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题,系统会通过大语言模型生成故事内容,并结合AI生成的图像、音频和字幕,输出完整的视...最新AI资源# AI开源项目# AI视频生成工具7个月前022.4K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具综合介绍 LangWatch 是一个专为大语言模型(LLM)操作而设计的综合平台,提供监控、分析、评估、数据集管理和提示优化等功能。该平台基于斯坦福大学的 DSPy 框架,旨在帮助用户更好地管理和优化...最新AI资源# AI开源项目9个月前022.4K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt综合介绍 Promptimizer 是一个实验性的提示词优化库,旨在帮助用户系统地改进其AI系统的提示词。通过自动化的优化过程,Promptimizer 可以在特定任务上改进提示词的表现。用户只需提供...最新AI资源# AI开源项目# PROMPTS辅助工具11个月前022.4K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成综合介绍 这是一个由LangChain和NVIDIA联合开发的结构化报告生成蓝图项目,展示在GitHub上的Jupyter notebook教程。该项目利用先进的AI技术,特别是Llama-3.3-7...最新AI资源# AI开源项目# 生成深度研究报告7个月前022.4K
Awesome CursorRules:增强Cursor AI体验的规则集综合介绍 awesome-cursorrules 是一个专门为 Cursor AI 提供自定义规则文件的项目。Cursor AI 是一个由人工智能驱动的代码编辑器,.cursorrules 文件可以定...最新AI资源# AI开源项目# PROMPTS辅助工具1年前022.4K
SmolDocling:小体积高效处理文档的视觉语言模型综合介绍 SmolDocling 是由 ds4sd 团队与 IBM 合作开发的一个视觉语言模型(VLM),基于 SmolVLM-256M 打造,托管在 Hugging Face 平台。它体积小,只有 ...最新AI资源# AI开源项目# OCR# 文档提取与清洗7个月前022.4K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)综合介绍 OrionChat是一个基于网页的AI聊天界面,它为用户提供了一个统一的平台来与多个主流AI模型进行交互。该项目支持包括Ollama(本地运行)、OpenAI GPT、Google Gemi...最新AI资源# AI开源项目# AI本地化聊天应用10个月前022.4K
FramePainter:AI驱动的涂鸦式图像编辑工具综合介绍 FramePainter 是一个革命性的 AI 驱动图像编辑工具,利用先进的视频扩散技术和直观的 Sketch 控件,帮助用户轻松实现复杂的图像编辑。无论是简单的调整还是复杂的创意变换,Fr...最新AI资源# AI图像编辑# AI开源项目# AI涂鸦生成绘画9个月前022.4K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用综合介绍 Gemini Next Chat 是一个开源项目,旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型,用户可以通过一键部署在Vercel...最新AI资源# AI开源项目# AI本地化聊天应用9个月前022.4K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库,为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术,实现了低延...最新AI资源# AI开源项目10个月前022.4K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展综合介绍 MultiPost-Extension 是一个功能强大的浏览器扩展,旨在帮助用户一键发布内容到多个社交媒体平台。该扩展支持同步发布到超过10个主流平台,包括知乎、微博、小红书、TikTok ...最新AI资源# AI开源项目# AI社交媒体8个月前022.4K
AIEvo:创建多智能体协作应用的高效框架综合介绍 AIEvo是蚂蚁集团开源的多代理框架,旨在高效创建多代理应用。该框架严格遵循SOP任务图,提升复杂任务的执行成功率,并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...最新AI资源# AI开源项目# 智能体开发框架9个月前022.4K
Cerebr:与网页内容对话的开源浏览器插件综合介绍 Cerebr 是一个功能强大的 Chrome 浏览器 AI 助手扩展,旨在提升用户的工作效率和学习体验。Cerebr 的设计理念源于对简洁、高效浏览器 AI 助手的需求,凭借其极简设计和强大...最新AI资源# AI开源项目# 浏览器AI助手6个月前022.4K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架综合介绍 PrimisAI Nexus 是一个轻量级的开源Python框架,托管于GitHub,由PrimisAI团队开发,旨在通过大语言模型(LLM)帮助用户构建和管理可扩展的AI多智能体系统,实现...最新AI资源# AI开源项目# 智能体开发框架7个月前022.4K
Mobius Diffusion:文本提示生成无缝循环视频综合介绍 Mobius Diffusion 是一个创新的在线工具,专注于通过文本输入生成无缝循环的视频内容。它基于预训练的视频扩散模型,无需用户自行训练或提供标注数据即可快速上手。网站的核心技术是通过...最新AI资源# AI开源项目# AI文本转视频8个月前022.3K
Genspark2api(失效)综合介绍 genspark2api 是一个开源的 API 服务工具,托管在 GitHub 上,由开发者 deanxv 创建。它提供了一个支持多模型对话、文生图和文生视频的接口服务,用户可以通过 Doc...最新AI资源# AI开源项目# 免费大模型API7个月前022.3K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站综合介绍 AigoTools 是一个开源AI网址导航,旨在帮助用户快速创建和管理导航站点。它内置站点管理和基于AI的自动收录功能,支持多语言、暗色/亮色主题切换,以及SEO优化。AigoTools 提...最新AI资源# AI副业赚钱项目# AI开源项目12个月前022.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权综合介绍 VideoSeal是由Facebook Research开发的开源视频水印工具,旨在提供高效的视频水印嵌入与提取功能。该工具支持最新的开源模型,包含预训练模型、训练代码、推理代码和评估工具...最新AI资源# AI开源项目# AI音视频编辑10个月前022.3K
MemFree:本地知识库与搜索信息混合的AI搜索引擎综合介绍 MemFree 是一个先进的混合AI搜索引擎,能够通过文本、图像、文件和网页进行搜索和提问。它提供一键获取文本、思维导图、图像和视频的搜索结果的功能。MemFree 的目标是从用户的知识库和...最新AI资源# AI开源项目# AI搜索工具1年前022.3K
XDOllama:适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。综合介绍 XDOllama 是一款专为 MacOS 用户设计的桌面应用程序,旨在快速调用 Ollama、Dify 和 Xinference 等 AI 模型。该应用程序通过简化的界面和操作流程,使用户能...最新AI资源# AI开源项目# AI本地化聊天应用11个月前022.3K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告综合介绍 DataLine是一个强大的AI数据分析和可视化工具,旨在帮助用户通过简单的操作与各种数据源进行交互。无论是CSV文件还是主流数据库如Postgres、MySQL、Snowflake、SQL...最新AI资源# AI开源项目# AI数据分析8个月前022.3K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案综合介绍 GPTMe是一款革命性的终端AI助手工具,专为提升开发者工作效率而设计。它将强大的AI能力与终端环境完美结合,支持代码执行、文件编辑、网页浏览和视觉识别等多样化功能。作为ChatGPT代码解...最新AI资源# AI开源项目# AI编程10个月前022.3K
Agent-Wiz:分析AI智能体工作流程和安全风险综合介绍 Agent-Wiz 是一个开源的Python命令行工具,专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程,生...最新AI资源# AI开源项目# 智能体开发框架6个月前022.3K
BotSharp:基于.NET的多智能体AI应开发与管理平台综合介绍 BotSharp是基于.NET Core的一个开源项目,致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程,支持跨平台操作,旨在简化机器学习算法的应用,使企业级开发者能够高效地将...最新AI资源# AI开源项目# 智能体开发框架9个月前022.3K
CortexON:开源多代理AI工具,支持复杂任务自动化综合介绍 CortexON 是一个开源的多代理 AI 系统,托管在 GitHub 上,网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...最新AI资源# AI开源项目# 智能体应用7个月前022.3K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序,集成了大型语言模型(LLM)驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG(Re...最新AI资源# AI开源项目# AI笔记11个月前022.3K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)综合介绍 Flashcard是一个开源的语言学习工具,旨在提供一个替代Duolingo的解决方案。该项目由Steven Lynn(GitHub用户名:stvlynn)开发,采用现代化的用户界面和多语言...最新AI资源# AI开源项目# AI教育工具8个月前022.3K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档综合介绍 Doc2XAPITranslate 是一个强大的文档全文翻译工具,专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器,包括DeepSeek、OpenAI、O...最新AI资源# AI开源项目# AI翻译9个月前022.3K
BadSeek V2:动态注入后门代码的实验性大型语言模型综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型(LLM)。该模型具备动态注入“后门”代码的能力,能够在生成代码时添加恶意行为,同时保持与基础...最新AI资源# AI开源项目8个月前022.2K
TxAgent:帮医生分析药物作用和治疗方案的AI工具综合介绍 TxAgent 是哈佛大学医学与科学人工智能团队(MIMS)开发的一款开源AI工具,旨在帮助医生分析药物相互作用并制定个性化治疗方案。它通过多步骤推理和实时检索生物医学知识,结合患者的具体情...最新AI资源# AI开源项目# 智能体应用7个月前022.2K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人综合介绍 DeepSeek-RAG-Chatbot 是一个基于 DeepSeek R1 模型构建的开源聊天机器人项目,托管于 GitHub,由开发者 SaiAkhil066 创建。它结合了检索增强生成...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前022.2K
Curiosity:使用LangGraph构建类似 Perplexity 的AI搜索工具综合介绍 Curiosity 是一个旨在探索和实验的项目,主要使用 LangGraph 和 FastHTML 技术栈,目标是构建一个类似 Perplexity AI 的搜索产品。项目的核心是一个简单的...最新AI资源# AI开源项目# AI搜索工具1年前022.2K
Reactive Resume:支持多语言、多模板的开源免费简历生成器综合介绍 Reactive Resume 是一个免费且开源的简历生成器,旨在简化创建、更新和分享简历的过程。该平台注重用户隐私,没有任何用户跟踪或广告。用户可以在不到30秒内自托管应用程序,完全掌控自...最新AI资源# AI开源项目# AI生活效率助手10个月前022.2K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想综合介绍 TextDistiller 是一款先进的人工智能驱动工具,旨在对书籍进行逐章或整体总结,提供简洁而全面的概述。通过使用 TextDistiller,用户能够快速掌握任何书籍的核心思想和关键要...最新AI资源# AI开源项目# AI文本与音频/视频总结工具10个月前022.2K
Claude生成深度研究报告的MCP服务综合介绍 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度...最新AI资源# AI开源项目# MCP服务# 生成深度研究报告5个月前022.2K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件综合介绍 Auto-Coder.Chat 是一款基于终端的 AI 辅助编程工具,旨在通过智能化手段提升开发者的编程效率。该工具可以与任意 IDE 搭配使用,使开发工具具备 AI 辅助编程能力。Auto...最新AI资源# AI开源项目# AI编程6个月前022.1K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...最新AI资源# AI开源项目# OCR# 文档提取与清洗9个月前022.1K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架综合介绍 SkyPilot 是一个由加州伯克利大学 Sky Computing Lab 发起的开源框架,旨在帮助用户在任何云端基础设施上高效运行 AI 和批处理任务。它支持超过 14 种云服务(包括 ...最新AI资源# AI开源项目8个月前022.1K
Vibe Draw:将手绘草图转化为3D模型的创意工具综合介绍 Vibe Draw 是一个开源项目,它由 Martin Sit 开发,能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单:让任何人都能轻松做 3D 建模,不需要高超的艺术技巧或复...最新AI资源# AI开源项目# AI文本与图片转3D# AI涂鸦生成绘画7个月前022.1K
ReCamMaster:从单一视频生成多视角视频的渲染工具综合介绍 ReCamMaster 是一个开源视频处理工具,核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹,重新渲染视频,获得不同角度的动态画面。它由浙江大学、快手科技等团队开发,基于文本到...最新AI资源# AI开源项目# AI视频转换风格6个月前022.1K
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目,旨在通过“Modality-specific Normalization for Virtual Try-On”(MNVTON)技术...最新AI资源# AI开源项目# AI换脸与换装9个月前022.1K
agents.json:智能体通过自然语言与API交互的开源规范综合介绍 agents.json 是 Wildcard AI 团队开发的一款开源规范,基于 OpenAPI 标准,旨在让智能体通过自然语言与 API 实现高效通讯。它通过结构化的 JSON 文件定义智...最新AI资源# AI开源项目7个月前022.1K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树综合介绍 OmniThink 是一个创新的机器写作框架,旨在通过模拟人类认知过程中的迭代扩展和反思,生成高质量的长篇文章。该框架专注于扩展知识边界,生成的信息丰富且具有深度。OmniThink 通过构...最新AI资源# AI写作# AI开源项目9个月前022.1K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练综合介绍 LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上...最新AI资源# AI开源项目# AI教育工具7个月前022.1K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI资源# AI开源项目9个月前022.1K
HiveChat:适合公司内部快速部署的AI聊天机器人综合介绍 HiveChat 是一个为中小型团队设计的 AI 聊天机器人,允许管理员一次性配置多种 AI 模型(如 Deepseek、OpenAI、Claude 和 Gemini),方便团队成员使用。它...最新AI资源# AI开源项目# AI集成多模型对话平台8个月前022.1K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率综合介绍 CHRONOS是由阿里巴巴NLP团队开发的一款新闻时间线总结工具。该工具通过迭代自我提问的方式,生成新闻事件的时间线总结。CHRONOS不仅能够处理开放领域的时间线总结任务,还能在效率和可扩...最新AI资源# AI开源项目# AI文本与音频/视频总结工具9个月前022.1K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度综合介绍 VoAPI 是一个全新的高颜值、高性能的 AI 模型接口管理与分发系统,主要用于个人或企业内部的管理与分发渠道。该系统基于 NewAPI 开发,提供了丰富的功能模块和优化的用户界面,旨在提升...最新AI资源# AI开放服务# AI开源项目11个月前022K
Cloudflare Agents:在边缘网络上构建实时交互的智能体综合介绍 Cloudflare Agents 是 Cloudflare 推出的一款开源开发框架,旨在帮助开发者在全球边缘网络上构建智能AI代理。它让代理具备状态持久化、实时通信和自主运行的能力,目前项...最新AI资源# AI开源项目# 智能体开发框架7个月前022K
TF-ID:学术论文表格/图像识别工具综合介绍 TF-ID(Table/Figure IDentifier)是一个专门用于从学术论文中提取表格和图像的对象检测模型家族。该项目由Yifei Hu创建,并在GitHub上开源。TF-ID模型经...最新AI资源# AI开源项目1年前022K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划综合介绍 OpenHealthForAll 是一个开源项目,旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术,OpenHealthForAll 提供了一个本地运行的健康助手,帮助用户更好地管理...最新AI资源# AI开源项目# AI生活效率助手8个月前022K
Vector Vein(向量脉络):无代码AI工作流构建平台综合介绍 Vector Vein 是一个无代码 AI 工作流构建平台,旨在帮助用户轻松创建智能化、自动化的工作流程。无需编程基础,用户只需通过拖拽操作即可将各种功能模块连接起来,构建出复杂的 AI 工...最新AI资源# AI开源项目# 低代码工作流11个月前022K
SuperCoder:命令行终端运行的智能代码助手综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支...最新AI资源# AI开源项目# AI编程7个月前022K
Audibit:将热门科技文章转为随时收听的音频播客综合介绍 Audibit 是一个开源项目,核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客,让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使...最新AI资源# AI开源项目# AI文本转语音5个月前022K
TripoSF:快速生成高分辨率3D模型的实用工具综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目,专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术,处理效率高,能在普...最新AI资源# AI开源项目# AI文本与图片转3D7个月前022K
CogView3:智谱轻言开源的级联扩散文本生成图像模型综合介绍 CogView3 是由清华大学和智囊团队(智谱清言)开发的先进文本生成图像系统。它基于级联扩散模型,通过多阶段生成高分辨率图像。CogView3 的主要特点包括多阶段生成、创新架构和高效性能...最新AI资源# AI在线生成图像# AI开源项目1年前022K
CRCT:递归分解大型代码任务并持久保存项目状态综合介绍 Cline Recursive Chain-of-Thought System(简称CRCT)是一个开源框架,专为在VS Code中管理大型代码项目而设计。当前版本为v7.0,它通过递归方式...最新AI资源# AI开源项目7个月前021.9K
BrownChat:开源实时语音聊天的AI助手综合介绍 BrownChat 是一个基于大型语言模型(LLM)技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发,旨在通过先进的自然语言处理技术提升用户的沟通体验。B...最新AI资源# AI开源项目# 多模态实时互动产品9个月前021.9K
OpenDeepSearch:支持智能推理的开源搜索工具综合介绍 OpenDeepSearch 是一个开源的搜索工具,由 sentient-agi 团队开发。它结合了大型语言模型(LLM)和智能推理代理,让用户可以用简单的方式搜索网页信息并获取准确答案。这...最新AI资源# AI开源项目# AI搜索工具7个月前021.9K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架综合介绍 PantoMatrix是一个先进的全身手势生成框架,能够从音频和部分手势生成完整的人体动作,包括面部、局部身体、手部和全身动作。该框架利用了最新的多模态数据集和深度学习技术,提供高质量的3D...最新AI资源# AI开源项目11个月前021.9K
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI资源# AI开源项目# MCP服务7个月前021.9K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制综合介绍 Ruyi-Models 是一个开源项目,旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发,支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...最新AI资源# AI图像转视频# AI开源项目10个月前021.9K
gpt prompt engineer:语言模型提示工程工具|优化提示指令综合介绍 gpt-prompt-engineer是一个GitHub上的开源项目,专注于GPT模型的提示工程。用户可以通过输入任务描述和测试用例,这个工具能够生成、测试,并排名不同提示以寻找表现最佳者...最新AI资源# AI开源项目# PROMPTS辅助工具1年前021.9K
GraphAgent:构建知识图谱,自动化任务规划与执行综合介绍 GraphAgent是一个集成了图生成、任务规划和任务执行的自动化智能体系统。它能够处理结构化和非结构化数据,构建复杂的语义依赖关系图谱,并通过自我规划和工具匹配高效执行用户任务。Graph...最新AI资源# AI开源项目# 知识图谱9个月前021.9K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作综合介绍 OmniParser是一个由微软开发的工具,旨在解析用户界面截图,将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...最新AI资源# AI开源项目8个月前021.8K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...最新AI资源# AI开源项目9个月前021.8K
MM-EUREKA:探索视觉推理的多模态强化学习工具综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心...最新AI资源# AI开源项目# 大模型微调7个月前021.8K
PicMenu:文字菜单转换为美观的图文菜单综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型...最新AI资源# AI开源项目11个月前021.8K
hugo-translator:自动翻译Hugo博客内容的Python脚本综合介绍 hugo-translator 是一个专为 Hugo 静态网站生成器设计的自动化翻译工具,托管在 GitHub 上,由开发者 Rico00121 创建。该工具旨在帮助 Hugo 用户将其博客...最新AI资源# AI开源项目# AI翻译7个月前021.8K
MyCoder:自动修复代码、生成测试用例的命令行AI工具综合介绍 MyCoder 是一个由 drivecore 团队开发并托管在 GitHub 上的开源项目,旨在通过命令行界面为开发者提供智能化的编程辅助。它基于 Anthropic 的 Claude AP...最新AI资源# AI开源项目# AI编程8个月前021.8K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地...最新AI资源# AI开源项目11个月前021.8K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端综合介绍 AIaW(AI as Workspace)是一个新一代的AI客户端,旨在提供全功能、轻量级且可拓展的解决方案。该平台支持多种服务商,包括OpenAI、Anthropic和Google等,能够...最新AI资源# AI开源项目# AI本地化聊天应用10个月前021.8K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎综合介绍 dsRAG是一款高性能检索引擎,专门用于处理非结构化数据的复杂查询。它在处理密集文本(如财务报告、法律文件和学术论文)中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能:语...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前021.8K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)综合介绍 Vision-is-all-you-need 是一个创新的视觉RAG(检索增强生成)系统演示项目,它突破性地将视觉语言模型(VLM)应用于文档处理领域。不同于传统的文本分块方法,该系统直接使...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# 知识检索与RAG框架9个月前021.8K
Denser Chat:与PDF文件互动,提供源代码高亮显示综合介绍 Denser Chat 是一个由 denser.ai 开发和维护的聊天机器人项目,旨在从 PDF 文件和网页中提取文本和表格,并提供源代码高亮显示功能。该项目支持构建基于 denser-re...最新AI资源# AI开源项目# AI文本与音频/视频总结工具10个月前021.8K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目综合介绍 小猿口算自动答题工具是一个基于Python的开源项目,旨在通过OCR识别和自动化脚本来高效解决小猿口算应用中的题目。该工具利用了OpenCV和Tesseract等技术,能够实时识别屏幕上的题...最新AI资源# AI开源项目# AI教育工具1年前021.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 ...最新AI资源# AI开源项目# 桌面自动化智能体8个月前021.8K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包综合介绍 Solana Agent Kit是一个开源工具包,旨在将AI智能体与Solana区块链协议无缝连接。无论是AI研究人员还是加密货币开发者,都可以使用任何模型训练的智能体,通过该工具包执行超过...最新AI资源# AI开源项目# 智能体开发框架8个月前021.8K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架,让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核...最新AI资源# AI开源项目# 桌面自动化智能体7个月前021.8K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型综合介绍 InternLM-XComposer 是由 InternLM 团队开发的一个开源图文多模态大模型项目,托管于 GitHub。它基于 InternLM 语言模型,能够处理文本、图像、视频等多模...最新AI资源# AI开源项目8个月前021.8K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架,旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案,简化了多智能体 LLM 系统的构建和...最新AI资源# AI开源项目# 智能体开发框架8个月前021.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字综合介绍 LongWriter是由清华大学数据挖掘研究组(THUDM)开发的一款强大的长文本生成工具。该工具基于先进的长上下文语言模型(LLM),能够生成超过10000字的长文本。LongWriter...最新AI资源# AI开源项目10个月前021.7K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件综合介绍 ChatGPT Box 是一个开源的浏览器扩展工具,旨在将 ChatGPT 深度集成到用户的浏览器中。该工具由 josStorer 开发,支持多种语言,并提供多种功能,如在任意页面调用聊天对...最新AI资源# AI开源项目# AI集成多模型对话平台# 浏览器AI助手6个月前021.7K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算综合介绍 Porkybank 是一个开源的个人财务管理应用,旨在帮助用户轻松追踪每日预算。通过简单的公式(收入 - 支出)/ 天数 = 现金,用户可以直观地了解自己的财务状况。该项目托管在 GitHu...最新AI资源# AI开源项目# AI生活效率助手9个月前021.7K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统,基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应,支持自然流畅的实...最新AI资源# AI开源项目# 多模态实时互动产品9个月前021.7K