Coding-Tutor:提供个性化编程指导的智能教学助手综合介绍 Coding-Tutor 是一个托管在 GitHub 上的开源项目,由开发者 iwangjian 创建,旨在为学习者提供个性化的编程教学体验。它通过对话式人工智能技术,根据用户的知识背景和学...最新AI资源# AI开源项目# AI教育工具1年前061.4K
ReCamMaster:从单一视频生成多视角视频的渲染工具综合介绍 ReCamMaster 是一个开源视频处理工具,核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹,重新渲染视频,获得不同角度的动态画面。它由浙江大学、快手科技等团队开发,基于文本到...最新AI资源# AI开源项目# AI视频转换风格1年前061.4K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI资源# AI开源项目# 文档提取与清洗1年前061.3K
MagicArticulate:将静态3D模型生成骨骼结构动画资产综合介绍 MagicArticulate 是一个由字节跳动与南洋理工大学合作开发的AI框架,专注于将静态3D模型快速转化为支持动画的数字资产。它通过先进的自回归Transformer和功能扩散模型,自...最新AI资源# AI开源项目# AI文本与图片转3D1年前061.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理...最新AI资源# AI开源项目1年前061.3K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程综合介绍 VimLM是一个Vim插件,提供了一个由本地LLM(大语言模型)驱动的代码助手。通过Vim命令与本地LLM模型交互,自动获取代码上下文,帮助用户在Vim中进行代码编辑。VimLM的设计灵感来...最新AI资源# AI开源项目# AI编程1年前061.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识综合介绍 Search-o1 是一个开源项目,旨在通过整合高级搜索机制来增强大规模推理模型(LRMs)的性能。其核心思想是通过动态的搜索和知识整合来解决推理过程中遇到的知识缺失问题。该项目由 sunn...最新AI资源# AI开源项目# AI搜索工具1年前061.3K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手综合介绍 Claude Engineer 是一个由 Doriandarko 开发的交互式命令行界面(CLI),利用 Anthropic 的 Claude-3.5-Sonnet 模型来协助软件开发任务...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用1年前061.3K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具,旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎,包括Google Translate、Microsoft Tra...最新AI资源# AI开源项目# AI翻译1年前061.3K
GraphGen:利用知识图谱生成合成数据微调语言模型综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...最新AI资源# AI开源项目# 大模型微调# 知识图谱11个月前061.2K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具综合介绍 OpenSearch-SQL 是一个开源项目,它是一个强大的 Text-to-SQL 工具,可以把用户的自然语言描述转化为 SQL 查询语句,帮助不熟悉数据库的人轻松获取数据。这个项目由 O...最新AI资源# AI开源项目# AI数据分析1年前061.2K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...最新AI资源# AI开源项目# 文档提取与清洗1年前061.2K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况综合介绍 ChatGPT 服务降级监测工具是一个开源项目,旨在帮助用户检测其 ChatGPT 服务是否因高风险 IP 而被降级。该工具通过分析 Proof of Work (PoW) 难度值,判断用户...最新AI资源# AI开源项目1年前061.2K
Plandex:支持超长上下文的开源AI编码助手综合介绍 Plandex 是一个开源的终端 AI 编码助手,专为大型复杂软件项目设计。它能规划和执行多步骤任务,处理高达 200 万 token 的上下文,支持 30 多种编程语言。Plandex 提...最新AI资源# AI开源项目# AI编程12个月前061.2K
OpenChat:快速集成多数据源的自定义聊天机器人综合介绍 OpenChat 是一个用户友好的聊天机器人控制台,旨在简化大语言模型(LLMs)的使用。通过提供两步设置流程,OpenChat 使用户能够轻松创建和管理多个自定义聊天机器人。该平台支持 G...最新AI资源# AI客服机器人# AI开源项目1年前061.1K
PRAG:提升问答系统性能的参数化检索增强生成工具综合介绍 PRAG(Parametric Retrieval-Augmented Generation)是一个创新的检索增强生成工具,旨在通过将外部知识直接嵌入大语言模型(LLM)的参数空间,提升生成...最新AI资源# AI开源项目# 知识检索与RAG框架1年前061K
Thera:任意尺寸图像放大、去锯齿的开源工具综合介绍 Thera 是一个开源的图像超分辨率工具,由苏黎世联邦理工学院(ETH Zurich)和苏黎世大学的团队开发。它能将低分辨率图像放大到任意尺度,比如 2 倍、3.14 倍甚至非整数倍,并且放...最新AI资源# AI图像放大与修复# AI开源项目1年前061K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...最新AI资源# AI开源项目# AI本地化聊天应用1年前060.9K
Orchestra:构建智能AI团队,让多智能体协作开发更简单高效综合介绍 Orchestra是一个创新的轻量级Python框架,专注于构建基于大语言模型(LLM)的多智能体协作系统。它采用独特的智能体编排方法,让多个AI智能体能够像交响乐团一样和谐配合工作。通过模...最新AI资源# AI开源项目# 智能体开发框架1年前060.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...最新AI资源# AI开源项目# 桌面自动化智能体1年前060.9K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性综合介绍 FitDiT是一个基于扩散变换器(Diffusion Transformers)的高保真虚拟试衣系统。该项目由腾讯AI Lab开发,旨在解决传统虚拟试衣系统在展示服装细节时的局限性。FitD...最新AI资源# AI开源项目# AI换脸与换装1年前060.9K
SiteMCP:抓取网站内容并转为MCP服务综合介绍 SiteMCP 是一个开源工具,核心功能是抓取整个网站的内容并将其转化为 MCP(Model Context Protocol)服务器,让 AI 助手(如 Claude Desktop)直接...最新AI资源# AI开源项目# MCP服务1年前060.9K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。综合介绍 RAGLite 是一个用于检索增强生成(RAG)的 Python 工具包,支持 PostgreSQL 或 SQLite 数据库。它提供了灵活的配置选项,允许用户选择不同的语言模型和重排序器...最新AI资源# AI开源项目# 知识检索与RAG框架1年前060.9K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频综合介绍 Magic 1-For-1 是一个高效的视频生成模型,旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务:文本到图像生成和图像到视频生成,从而实现更高效的训练和蒸馏...最新AI资源# AI开源项目# AI文本转视频1年前060.8K
Maestro:简化主流开源视觉语言模型微调过程的工具综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 F...最新AI资源# AI开源项目# 大模型微调1年前060.8K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模...最新AI资源# AI开源项目# 无代码开发# 知识检索与RAG框架1年前060.8K
agent-twitter-client:无需Twitter API密钥,发送、转发推文综合介绍 agent-twitter-client是一个无需Twitter API密钥即可使用的Twitter客户端。该项目基于@the-convocation/twitter-scraper进行了修...最新AI资源# AI开源项目# AI社交媒体1年前060.8K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序,由开发者 speedTD 创建,托管在 GitHub 上。它利用 Google Gemini 人工智能技术,让...最新AI资源# AI开源项目# AI换脸与换装1年前060.8K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集综合介绍 Harbor是一个革新性的容器化LLM工具集,专注于简化本地AI开发环境的部署和管理。它通过简洁的命令行界面(CLI)和配套应用程序,让开发者能够一键启动和管理包括LLM后端、API接口、前...最新AI资源# AI开源项目# 本地部署开源大模型工具1年前060.8K
ell:轻量级函数式提示词工程框架综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化...最新AI资源# AI开源项目# PROMPTS辅助工具1年前060.7K
Napkins.dev:基于Llama4上传线框图生成前端代码综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...最新AI资源# AI开源项目# AI页面设计1年前060.7K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和...最新AI资源# AI图像生成辅助工具# AI开源项目1年前060.7K
Arrakis:为AI智能体提供安全沙盒环境的开源工具综合介绍 Arrakis 是一个专为 AI 智能体设计,提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发,托管在 GitHub 上,使用 AGPL v3 许可证。Arrak...最新AI资源# AI开源项目1年前060.7K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师综合介绍 Srcbook是一个以TypeScript为核心的应用开发平台,旨在通过AI助手快速创建和迭代Web应用。它支持本地运行,提供交互式笔记本界面,允许用户编写和执行后端代码。Srcbook是开...最新AI资源# AI开源项目# AI编程1年前060.7K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...最新AI资源# AI开源项目# AI搜索工具1年前060.7K
Cloudflare Agents:在边缘网络上构建实时交互的智能体综合介绍 Cloudflare Agents 是 Cloudflare 推出的一款开源开发框架,旨在帮助开发者在全球边缘网络上构建智能AI代理。它让代理具备状态持久化、实时通信和自主运行的能力,目前项...最新AI资源# AI开源项目# 智能体开发框架1年前060.6K
Mahilo:连接不同AI智能体框架实时协作的集成平台综合介绍 Mahilo 是一个开源的多智能体集成平台,由开发者 Jayesh Sharma 在 GitHub 上发布,旨在帮助用户连接来自不同框架的 AI 智能体,支持实时通信、人机交互及智能协作。该...最新AI资源# AI开源项目# 智能体开发框架1年前060.6K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)综合介绍 DeepGEMM 是一个由 DeepSeek 团队开发的开源 FP8 GEMM(通用矩阵乘法)库,专注于提供高效的矩阵运算支持。它特别针对 NVIDIA Hopper 架构的 Tensor ...最新AI资源# AI开源项目1年前060.6K
FoleyCrafter:为无声视频添加生动同步的音效综合介绍 FoleyCrafter 是一个由 OpenMMLab 开发的开源项目,旨在为无声视频生成生动且同步的音效。该项目利用先进的人工智能技术,通过分析视频内容,生成与之语义相关且时间同步的音效...最新AI资源# AI开源项目# AI音乐1年前060.6K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架综合介绍 PantoMatrix是一个先进的全身手势生成框架,能够从音频和部分手势生成完整的人体动作,包括面部、局部身体、手部和全身动作。该框架利用了最新的多模态数据集和深度学习技术,提供高质量的3D...最新AI资源# AI开源项目1年前060.6K
UniAPI:免服务器统一管理大模型API转发综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器,核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API,比如 OpenAI、Azure OpenAI、Clau...最新AI资源# AI开源项目1年前060.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具综合介绍 lightcard 是一个简洁优雅的卡片生成工具,旨在帮助用户轻松创建精美的内容卡片。该工具支持自定义文字内容、多种主题样式和二维码,让创作变得更加简单有趣。用户可以通过编辑标题、正文和作者...最新AI资源# AI开源项目1年前060.6K
ALog:便携AI语音日记应用,支持语音转文字。综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文...最新AI资源# AI开源项目# AI语音转文本1年前060.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目综合介绍 Llama Tutor 是一个基于 Llama 3.1 构建的开源 AI 个人助教项目,旨在为用户提供个性化的学习体验。通过整合多种技术栈,如 Together AI、Next.js 和 T...最新AI资源# AI开源项目# AI教育工具1年前060.5K
Cooragent:一句话构建多智能体任务协作工具综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两...最新AI资源# AI开源项目# 智能体开发框架11个月前060.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统综合介绍 Simba是一个便携式知识管理系统(KMS),旨在与任何检索增强生成(RAG)系统无缝集成。该项目由GitHub用户GitHamza0206创建,提供了一种高效的知识管理解决方案,适用于各种...最新AI资源# AI开源项目# 知识检索与RAG框架1年前060.5K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端综合介绍 AIaW(AI as Workspace)是一个新一代的AI客户端,旨在提供全功能、轻量级且可拓展的解决方案。该平台支持多种服务商,包括OpenAI、Anthropic和Google等,能够...最新AI资源# AI开源项目# AI本地化聊天应用1年前060.5K
TgWechat:为微信提供端到端加密的聊天插件综合介绍 tgwechat是一个开源微信插件,由开发者dplusec开发。它通过端到端加密技术保护微信聊天隐私,让用户能安全地发送消息。项目于2019年8月31日在GitHub上线,采用GPL v3许...最新AI资源# AI开源项目1年前060.4K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具综合介绍 autoMate 是一款由 yuruotong1 在 GitHub 上开源开发的本地自动化工具,以 AI+RPA(人工智能+机器人流程自动化)为核心特色。它将大型语言模型的智能理解与 RPA...最新AI资源# AI开源项目# 桌面自动化智能体1年前060.4K
LocalGPT:在本地设备上与多文档对话,确保数据隐私综合介绍 LocalGPT是一个开源项目,旨在让用户在本地设备上与文档进行对话,确保数据隐私。通过使用各种开源模型,LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平...最新AI资源# AI开源项目# 知识检索与RAG框架1年前060.4K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)综合介绍 OrionChat是一个基于网页的AI聊天界面,它为用户提供了一个统一的平台来与多个主流AI模型进行交互。该项目支持包括Ollama(本地运行)、OpenAI GPT、Google Gemi...最新AI资源# AI开源项目# AI本地化聊天应用1年前060.3K
Open NotebookLM:将PDF转换为播客的开源工具综合介绍 Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话...最新AI资源# AI开源项目# AI文本转语音1年前060.3K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字综合介绍 LongWriter是由清华大学数据挖掘研究组(THUDM)开发的一款强大的长文本生成工具。该工具基于先进的长上下文语言模型(LLM),能够生成超过10000字的长文本。LongWriter...最新AI资源# AI开源项目1年前060.3K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能综合介绍 Deep Research是一个基于AI的研究助手,旨在通过结合搜索引擎、网页抓取和大语言模型,进行迭代的深度研究。该项目由dzhng在GitHub上发布,目标是提供一个简单易用的深度研究代...最新AI资源# AI开源项目# 生成深度研究报告1年前060.2K
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI资源# AI开源项目# AI教育工具# 论文1年前060.2K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发综合介绍 SuperWeChatPC 是一个开源的电脑端微信增强工具,核心是为用户和开发者提供便利。它最初解决微信只能单开的问题,后来加入了 WeChatSDK,让开发者可以调用微信功能,比如发送消息...最新AI资源# AI开源项目1年前060.1K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型综合介绍 GPT4Free 是一个由开发者 xtekky 在 GitHub 上发布的开源项目,旨在免费提供多种强大的语言模型,包括 GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...最新AI资源# AI开源项目# AI集成多模型对话平台1年前060.1K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架综合介绍 SkyPilot 是一个由加州伯克利大学 Sky Computing Lab 发起的开源框架,旨在帮助用户在任何云端基础设施上高效运行 AI 和批处理任务。它支持超过 14 种云服务(包括 ...最新AI资源# AI开源项目1年前060.1K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库,为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术,实现了低延...最新AI资源# AI开源项目1年前060.1K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程...最新AI资源# AI开源项目# AI语音转文本1年前060.1K
Awesome CursorRules:增强Cursor AI体验的规则集综合介绍 awesome-cursorrules 是一个专门为 Cursor AI 提供自定义规则文件的项目。Cursor AI 是一个由人工智能驱动的代码编辑器,.cursorrules 文件可以定...最新AI资源# AI开源项目# PROMPTS辅助工具2年前060K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码综合介绍 Onlook是一款开源的设计工具,专为设计师和开发者打造,允许用户直接在运行的React应用中进行设计,并将设计修改转换为代码。该工具提供了一种直观的视觉编辑体验,类似于Figma或Webf...最新AI资源# AI开源项目# AI页面设计1年前060K
LM Speed:快速测试大模型API性能综合介绍 LM Speed 是一个专门为AI开发者设计的工具,同时提供在线服务网站 lmspeed.net。它的核心功能是测试和分析语言模型 API 的性能,帮助用户快速发现速度瓶颈并优化调用策略。这...最新AI资源# AI开源项目1年前060K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用,主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能...最新AI资源# AI开源项目# AI搜索工具1年前060K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成综合介绍 这是一个由LangChain和NVIDIA联合开发的结构化报告生成蓝图项目,展示在GitHub上的Jupyter notebook教程。该项目利用先进的AI技术,特别是Llama-3.3-7...最新AI资源# AI开源项目# 生成深度研究报告1年前060K
PhiData:构建拥有记忆、知识和工具的AI智能体综合介绍 PhiData是一个专为开发智能AI助手而设计的框架。它通过增强记忆、知识整合和工具调用能力,使AI助手能够进行长期对话、提供精准的业务上下文,并执行各种操作。PhiData不仅提升了AI助...最新AI资源# AI开源项目# 智能体应用1年前059.9K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言综合介绍 askrepo 是一个基于LLM(大语言模型)的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容,并将其发送到Google Gemini API,根据指定的提示提供问题的答案...最新AI资源# AI开源项目1年前059.9K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用综合介绍 AI Dev Gallery是微软推出的一款专为Windows开发者设计的AI开发工具应用程序(目前处于公开预览版)。它提供了一个综合性平台,帮助开发者轻松地将AI功能集成到自己的Windo...最新AI资源# AI开源项目# 本地部署开源大模型工具1年前059.9K
CogView4:生成中英双语高清图片的开源文生图模型综合介绍 CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非...最新AI资源# AI开源项目# AI自部署图像生成工具1年前059.9K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI资源# AI开源项目# AI编程1年前059.8K
NodeTool:基于节点编排的AI模型工作流可视化客户端综合介绍 NodeTool 是一个创新的AI创作平台,旨在为AI爱好者、开发者、数据科学家和创意人士提供一个简单、直观的界面。无论您是艺术家、开发者还是初学者,NodeTool 都能帮助您快速原型化创...最新AI资源# AI开源项目# 低代码工作流1年前059.7K
PromptWizard:优化提示工程的开源框架,提升任务性能综合介绍 PromptWizard是微软开发的一个开源框架,采用自我进化机制,可以让模型自己生成、评价和改进提示词及生成示例,通过不断反馈来提高输出质量。它能够自主优化提示词、生成和选择合适的示例、并...最新AI资源# AI开源项目1年前059.7K
BuffGPT:企业级生成式AI应用低代码开发平台综合介绍 BuffGPT 是一个基于大语言模型(LLM)的开源AI应用开发平台,提供数据处理、模型调用、RAG检索和可视化工作流编排等开箱即用功能,帮助用户轻松构建和运营生成式AI应用。平台支持私有化...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架1年前059.7K
ColiVara:基于视觉嵌入的文档存储与检索服务综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别(OCR)或文本提取,避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式,包括 PDF...最新AI资源# AI开源项目# 知识检索与RAG框架1年前059.7K
SVLS:SadTalker增强版,使用人像视频生成数字人综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度...最新AI资源# AI开源项目# AI数字人1年前059.7K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI资源# AI开源项目# AI视频转换风格1年前059.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...最新AI资源# AI开源项目12个月前059.7K
AIHawk:智能求职助手,自动化投放简历(限英文)综合介绍 Auto_Jobs_Applier_AIHawk 是一款利用人工智能技术自动化求职的工具。它能够帮助用户在短时间内自动投递大量简历,并根据用户的个人信息和求职意向进行个性化调整。该工具旨在提...最新AI资源# AI开源项目# AI生活效率助手1年前059.6K
LLManager:智能自动化流程审批与人类审核结合的管理工具综合介绍 LLManager 是一个开源的智能审批管理工具,基于 LangChain 的 LangGraph 框架开发,专注于自动化处理审批请求,同时结合人类审核优化决策。它通过语义搜索、少样本学习和...最新AI资源# AI开源项目# 专业生产力工具12个月前059.6K
自动解析PDF内容并提取文字与表格的开源服务综合介绍 它能自动分析PDF文档的布局,识别页面中的文字、标题、图片、表格、公式等元素,并判断它们的正确顺序。工具支持OCR功能,可以把扫描PDF转为可搜索文本。它基于Docker运行,提供两种模型...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前059.5K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI综合介绍 ChatOllama是一个基于大型语言模型(LLM)的开源在线聊天应用项目,支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理(列表展示、下载、删除)、与模型聊天等功能。项目运用了...最新AI资源# AI开源项目# AI本地化聊天应用# 知识检索与RAG框架2年前059.5K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试综合介绍 aisuite 是一个简单、统一的接口,旨在让开发者能够轻松调用多种生成式AI提供商的服务。通过类似于OpenAI的接口,aisuite 使得与最流行的LLM(大语言模型)进行交互变得更加容...最新AI资源# AI开源项目1年前059.5K
OAK:可视化构建智能体应用的开源项目综合介绍 OAK(Open Agent Kit)是一个开源工具,帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型(LLM),比如OpenAI、Google或Anthropic的模型...最新AI资源# AI开源项目# 智能体应用1年前059.5K
Gaze-LLE: 视频中人物注视目标预测工具综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...最新AI资源# AI开源项目# 视觉目标检测1年前059.5K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人综合介绍 Base Chat 是一个多租户聊天机器人,使用 Ragie Connect 连接并与组织的知识库进行对话。该项目是 Ragie 多项功能的参考应用,基于 Next.js 构建,支持 Goo...最新AI资源# AI开源项目# AI本地化聊天应用1年前059.4K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库,专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作,确保通信流和任务分...最新AI资源# AI开源项目# 智能体开发框架1年前059.4K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架综合介绍 PrimisAI Nexus 是一个轻量级的开源Python框架,托管于GitHub,由PrimisAI团队开发,旨在通过大语言模型(LLM)帮助用户构建和管理可扩展的AI多智能体系统,实现...最新AI资源# AI开源项目# 智能体开发框架1年前059.4K
HumanOmni:分析人类视频情感和动作的多模态大模型综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 2...最新AI资源# AI开源项目# 视觉目标检测1年前059.4K
Describe Anything:为图像和视频区域生成详细描述的开源工具综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的...最新AI资源# AI开源项目# 视觉目标检测11个月前059.3K
NextChat:兼容多平台的本地化AI聊天助手综合介绍 NextChat是一项革命性的AI聊天服务,允许用户部署与GPT-3、GPT-4、GPT-4.5和Gemini Pro等一流语言模型的聊天服务。它提供了优雅的用户界面、协作特性、集成、模板和...最新AI资源# AI开放服务# AI开源项目# AI本地化聊天应用1年前059.3K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客综合介绍 Robo Blogger 是一个创新的博客创作工具,旨在通过语音转文字技术简化内容生成过程。用户可以通过任何语音转文字应用记录想法,Robo Blogger 将这些想法转化为结构化的博客内容...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前059.3K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流综合介绍 Director 是一个开源框架,旨在通过构建智能视频代理来简化和优化视频交互和工作流程。该框架基于 VideoDB 的“视频即数据”基础设施,能够处理复杂的视频任务,如搜索、编辑、编译和生...最新AI资源# AI开源项目# AI音视频编辑1年前059.2K
Vision Agent:解决多种视觉目标检测任务的视觉智能体综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...最新AI资源# AI开源项目# 视觉目标检测1年前059.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...最新AI资源# AI开源项目# 本地部署开源大模型工具11个月前059.2K
Cerebr:与网页内容对话的开源浏览器插件综合介绍 Cerebr 是一个功能强大的 Chrome 浏览器 AI 助手扩展,旨在提升用户的工作效率和学习体验。Cerebr 的设计理念源于对简洁、高效浏览器 AI 助手的需求,凭借其极简设计和强大...最新AI资源# AI开源项目# 浏览器AI助手1年前059.2K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库综合介绍 RAG Web UI 是一个基于 RAG(检索增强生成)技术的智能对话系统。它帮助企业和个人构建基于自身知识库的智能问答系统。通过结合文档检索和大语言模型,RAG Web UI 提供准确可靠...最新AI资源# AI开源项目# 知识检索与RAG框架1年前059K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台综合介绍 AutoGPT是一个强大的平台,旨在帮助用户创建、部署和管理连续运行的AI代理,自动化复杂的工作流。该平台由Significant Gravitas开发,提供了多种工具和功能,使用户能够专注...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架1年前059K
CodeWeaver:将代码结构和内容自动生成Markdown文档综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具...最新AI资源# AI开源项目# 文档提取与清洗1年前059K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...最新AI资源# AI开源项目# 桌面自动化智能体1年前059K