ACE++:用文本指令精准对图像局部编辑的多功能开源工具综合介绍 ACE++ 是由阿里巴巴通义实验室(Tongyi Lab)的 ali-vilab 团队开发的一个开源项目。它基于 FLUX.1-Fill-dev 模型,旨在通过简单的文字指令实现图像生成和编...最新AI资源# AI图像编辑# AI开源项目# AI换脸与换装7个月前024.5K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程9个月前024.5K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI资源# AI开源项目# AI视频转换风格9个月前024.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发综合介绍 Dynamiq是一个开源的AI编排框架,专为代理AI和大语言模型(LLM)应用而设计。它旨在简化AI驱动应用程序的开发,特别是在检索增强生成(RAG)和LLM代理的编排方面。Dynamiq提...最新AI资源# AI开源项目# 智能体开发框架11个月前024.4K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章综合介绍 Paper Reviewer 是一个开源项目,旨在从 arXiv 论文生成综合评审,并将其转化为博客文章。该项目为 Hugging Face 的 Daily Papers 网站提供支持,自动...最新AI资源# AI开源项目# AI文本与音频/视频总结工具11个月前024.4K
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前024.4K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测综合介绍 Forecast AI 是一个基于先进人工智能技术的超级预测平台。它利用强大的数据分析和机器学习算法,为用户提供高精度的未来事件预测。无论是政治选举、经济趋势还是社会事件,Forecast ...最新AI资源# AI开源项目# AI搜索工具1年前024.4K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手综合介绍 Claude Engineer 是一个由 Doriandarko 开发的交互式命令行界面(CLI),利用 Anthropic 的 Claude-3.5-Sonnet 模型来协助软件开发任务...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用7个月前024.4K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署综合介绍 DocsGPT 是一个开源的文档助手,旨在简化项目文档查询过程。通过集成强大的 GPT 模型,开发者可以轻松地就项目提出问题并获得准确的答案。DocsGPT 支持本地部署,确保数据隐私,同时...最新AI资源# AI开源项目# AI文本与音频/视频总结工具11个月前024.4K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台,适用于个人使用。该项目...最新AI资源# AI开源项目9个月前024.4K
OpenChat:快速集成多数据源的自定义聊天机器人综合介绍 OpenChat 是一个用户友好的聊天机器人控制台,旨在简化大语言模型(LLMs)的使用。通过提供两步设置流程,OpenChat 使用户能够轻松创建和管理多个自定义聊天机器人。该平台支持 G...最新AI资源# AI客服机器人# AI开源项目9个月前024.4K
ColiVara:基于视觉嵌入的文档存储与检索服务综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别(OCR)或文本提取,避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式,包括 PDF...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前024.4K
BuffGPT:企业级生成式AI应用低代码开发平台综合介绍 BuffGPT 是一个基于大语言模型(LLM)的开源AI应用开发平台,提供数据处理、模型调用、RAG检索和可视化工作流编排等开箱即用功能,帮助用户轻松构建和运营生成式AI应用。平台支持私有化...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架7个月前024.4K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具综合介绍 Cursor Auto Register 是一个开源项目,托管在 GitHub 上。它由开发者 ddCat-main 创建,旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号...最新AI资源# AI开源项目7个月前024.4K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行,而不是替代工作流程的创建。ComfyUI-dis...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI9个月前024.4K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)综合介绍 Quanta Quest是全球首个以“端侧大模型+C端数据本地化”为核心演进方向的产品。它帮助用户将Gmail、Notion、Dropbox等所有数据存储到本地,并通过向量数据库进行处理,确...最新AI资源# AI开源项目# 知识检索与RAG框架12个月前024.3K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前024.3K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护综合介绍 Higress是阿里巴巴开发的一款云原生API网关,基于Istio和Envoy构建,旨在提供高效的流量调度、服务治理和安全防护解决方案。它支持多种编程语言的Wasm插件扩展,适用于AI业务...最新AI资源# AI开源项目11个月前024.3K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频综合介绍 Thin-Plate-Spline-Motion-Model是一个在CVPR 2022会议上发表的开创性图像动画生成项目。该项目基于薄板样条变换理论,能够将静态图像根据驱动视频实现高质量的动...最新AI资源# AI开源项目# AI视频换脸9个月前024.3K
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI资源# AI开源项目# 文档提取与清洗4个月前024.3K
Kreuzberg:从任何文档中提取文本的开源工具综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generatio...最新AI资源# AI开源项目# 文档提取与清洗8个月前024.3K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台,专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型,包括基于扩散和自回归的世界...最新AI资源# AI开放服务# AI开源项目9个月前024.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台综合介绍 Neural4D 是一个基于人工智能的创新平台,专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发,依托世界领先的端到端3D生成大模型技...最新AI资源# AI开源项目# AI文本与图片转3D8个月前024.3K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片...最新AI资源# AI开源项目# 文档提取与清洗7个月前024.2K
Supermemory:导入书签和网页内容构建个人知识库综合介绍 Supermemory 是一个开源项目,旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术,让用户能够轻松保存、组织和检索来自网页、Twitter书签...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前024.2K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体10个月前024.2K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人综合介绍 Base Chat 是一个多租户聊天机器人,使用 Ragie Connect 连接并与组织的知识库进行对话。该项目是 Ragie 多项功能的参考应用,基于 Next.js 构建,支持 Goo...最新AI资源# AI开源项目# AI本地化聊天应用8个月前024.2K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格综合介绍 Maxun是一个开源的无代码网页数据提取平台,用户可以在几分钟内训练机器人,自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动,能够适应网站布局的变化,提供强大的数据抓取功能...最新AI资源# AI开源项目# 文档提取与清洗9个月前024.2K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...最新AI资源# AI开源项目10个月前024.2K
Knowledge Table:高效提取与探索结构化数据的开源工具综合介绍 知识表(Knowledge Table)是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示,如表格和图形。该工具支持自定义提...最新AI资源# AI开源项目# 知识图谱1年前024.2K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索综合介绍 Hoarder 是一个自主托管的书签管理工具,支持链接、笔记、PDF和图像的存储。它利用 AI 技术进行自动标记,并提供全文搜索功能。用户可以通过 Chrome 插件和 Firefox 插件...最新AI资源# AI开源项目# AI生活效率助手10个月前024.2K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和...最新AI资源# AI图像生成辅助工具# AI开源项目9个月前024.2K
闲鱼卖家全天自动值守的AI客服机器人综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统,由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守,帮助闲鱼卖家回复...最新AI资源# AI副业赚钱项目# AI客服机器人# AI开源项目7个月前024.2K
MoBA: Kimi 推出的支持长上下文处理的大语言模型综合介绍 MoBA(Mixture of Block Attention)是由MoonshotAI开发的一种创新注意力机制,专为长上下文处理的大语言模型(LLMs)设计。MoBA通过将全上下文划分为多...最新AI资源# AI开源项目8个月前024.2K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...最新AI资源# AI开源项目# 多模态实时互动产品9个月前024.2K
免服务器生成永久微信群二维码综合介绍 serverless-qrcode-hub 是一个开源工具,专为解决微信群聊二维码频繁失效的问题而设计。它基于 Cloudflare Workers 和 D1 数据库,无需传统服务器即可运行...AI实操教程# AI开源项目6个月前024.2K
Coding Agent:基于Langgraph构建的简单编程助手综合介绍 Coding Agent 是一个由 AbhinavTheDev 开发的智能编程助手,旨在帮助开发者提高编程效率。该工具利用人工智能技术,能够自动生成代码、提供编程建议,并协助开发者完成各种编...最新AI资源# AI开源项目# AI编程9个月前024.1K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音(TTS)模型库,旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格(如性别、音调、说话风...最新AI资源# AI开源项目# AI文本转语音8个月前024.1K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成...最新AI资源# AI开源项目# AI本地化聊天应用9个月前024.1K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目6个月前024.1K
PhiData:构建拥有记忆、知识和工具的AI智能体综合介绍 PhiData是一个专为开发智能AI助手而设计的框架。它通过增强记忆、知识整合和工具调用能力,使AI助手能够进行长期对话、提供精准的业务上下文,并执行各种操作。PhiData不仅提升了AI助...最新AI资源# AI开源项目# 智能体应用7个月前024.1K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师综合介绍 Srcbook是一个以TypeScript为核心的应用开发平台,旨在通过AI助手快速创建和迭代Web应用。它支持本地运行,提供交互式笔记本界面,允许用户编写和执行后端代码。Srcbook是开...最新AI资源# AI开源项目# AI编程11个月前024.1K
Cooragent:一句话构建多智能体任务协作工具综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两...最新AI资源# AI开源项目# 智能体开发框架5个月前024.1K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室(Ali-Vilab)开发的一个开源项目,专注于线稿上色的自动化处理。这一工具通过深度学习技术,实现了对参考图像的精确色彩匹配,极大地提高...最新AI资源# AI图像风格控制# AI开源项目9个月前024.1K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目10个月前024.1K
Screenshot to Code:将截图转换为干净前端代码的AI工具综合介绍 Screenshot-to-Code 是一个开源工具,利用人工智能将截图、设计稿和 Figma 设计转换为干净、功能性的代码。该工具支持多种前端技术栈,包括 HTML、Tailwind CS...最新AI资源# AI开源项目# AI页面设计12个月前024.1K
语析(Yuxi-Know):基于知识图谱的智能问答平台综合介绍 Yuxi-Know 是一个开源的智能问答平台,结合知识图谱和 RAG(检索增强生成)技术,帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱,使用 FastAPI 和 VueJS 构...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架6个月前024.1K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞综合介绍 X-Dyna 是由字节跳动开发的一个开源项目,旨在通过零样本扩散技术生成动态人像动画。该项目利用驱动视频中的面部表情和身体动作来动画化单个人像图像,生成逼真且具有上下文感知的动态效果。X-D...最新AI资源# AI图像转视频# AI开源项目9个月前024.1K
FantasyTalking:生成真实感说话肖像的开源工具综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1,结合音频编码器 Wa...最新AI资源# AI开源项目# AI数字人5个月前024.1K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架9个月前024.1K
Quadratic:集成AI对话和代码执行的在线数据分析表格综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic...最新AI资源# AI开源项目# AI数据分析8个月前024K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现,适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确...最新AI资源# AI开源项目# AI文本转视频1年前024K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情,提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地,确保用户...最新AI资源# AI开源项目# AI金融数据分析8个月前024K
Langui:开源的AI用户界面组件库综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...最新AI资源# AI开源项目# AI页面设计9个月前024K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据综合介绍 A_Share_investment_Agent 是一个基于多智能体系统的A股投资决策辅助工具。该系统旨在通过多个协作智能体来分析市场数据、计算股票内在价值、分析市场情绪以及基本面数据,从而...最新AI资源# AI开源项目# AI金融数据分析9个月前024K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段综合介绍 MuseGAN是一个基于生成对抗网络(GAN)的音乐生成项目,旨在生成多轨(多种乐器)音乐。该项目能够从零开始生成音乐,或根据用户提供的轨道进行伴奏。MuseGAN使用Lakh Pianor...最新AI资源# AI开源项目# AI音乐10个月前024K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目,旨在通过频率分解技术实现身份一致的文本到视频生成(IPT2V)。该项目的核心是一个基于DiT(Diffusion Transfor...最新AI资源# AI开源项目# AI文本转视频10个月前024K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol(模型上下文协议)的开源工具,托管于 GitHub,由开发者 Zach Caceres ...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗7个月前024K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理综合介绍 DB-GPT是一个开源的AI原生数据应用开发框架,采用AWEL(Agentic Workflow Expression Language)和智能体技术构建。该项目旨在大模型领域构建基础设施...最新AI资源# AI开源项目# AI数据分析# 知识检索与RAG框架7个月前024K
wdoc:从海量、多源文档中检索内容并总结知识综合介绍 wdoc是一个功能强大的RAG(检索增强生成)系统,专为处理和分析大量多样化的文档而设计。它能够从各种文件类型中进行检索,包括PDF、网页、YouTube视频、音频文件等。wdoc特别适合处...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前024K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台,旨在每天自动抓取 Hacker News 上的热门文章,并通过 AI 生成中文总结和播报内容。该项目由 ccbikai ...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前024K
Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室(Shanghai AI Laboratory)、香港中文大学(CUHK)等机构联合开发的开源项目,托管于 GitHub,由 Alpha...最新AI资源# AI开源项目6个月前024K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具综合介绍 Bilingual Book Maker 是一个开源项目,旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译,支持多种文件格式,包括epub、txt和srt...最新AI资源# AI开源项目# AI翻译8个月前024K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts综合介绍 LangChain推出的Open Canvas 是一个开源的网络应用程序,旨在通过内置的双代理记忆功能来提升文档编辑和协作体验,并且集成smith可以观察完整的执行细节。该平台受 OpenA...最新AI资源# AI写作# AI开源项目# AI画布7个月前024K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成综合介绍 PandasAI是一个基于Python的开源平台,旨在通过自然语言处理技术简化数据分析过程。使用户能够以对话的方式与数据库(如 SQL、CSV、pandas、polars、mongodb、n...最新AI资源# AI开源项目# AI数据分析11个月前024K
RealtimeVoiceChat:低延迟与AI进行自然口语对话综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...最新AI资源# AI开源项目# 多模态实时互动产品5个月前024K
Open Operator:通过AI智能体在云浏览器中执行自动化操作综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...最新AI资源# AI开源项目# 桌面自动化智能体9个月前023.9K
Ovis:视觉与文本对齐模型,精准反推图像提示词综合介绍 Ovis(Open VISion)是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型(MLLM),托管于 GitHub。该模型采用创新的结构嵌入对齐技术,将视...最新AI资源# AI图像生成辅助工具# AI开源项目7个月前023.9K
VideoMind:视频按时间戳定位内容与问答的开源项目综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI音视频编辑4个月前023.9K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...最新AI资源# AI开源项目# 文档提取与清洗9个月前023.9K
Probly:AI分析数据并生成图表的开源表格工具综合介绍 Probly 是一个由 PragmaticMachineLearning 团队开发并在 GitHub 上开源的电子表格工具,结合了传统电子表格的功能与强大的 AI 数据分析能力。它不仅支持用...最新AI资源# AI开源项目# AI数据分析7个月前023.9K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...最新AI资源# AI开源项目# 文档提取与清洗9个月前023.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成...最新AI资源# AI图像风格控制# AI开源项目9个月前023.9K
Dolphin:面向亚洲语言识别与语音转文本模型综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型,专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言,以及 22 种中国方言...最新AI资源# AI开源项目# AI语音转文本6个月前023.9K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...最新AI资源# AI开源项目# 多模态实时互动产品9个月前023.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加...最新AI资源# AI开源项目# AI教育工具1年前023.9K
InternVL:开源多模态大模型,支持图像、视频和文本处理综合介绍 InternVL 是由上海人工智能实验室(OpenGVLab)开发的一个开源多模态大模型项目,托管在 GitHub 上。它集成了视觉和语言处理能力,支持图像、视频和文本的综合理解与生成。In...最新AI资源# AI开源项目6个月前023.9K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具,旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道,通过参考图像池准确生成各种元素的颜色,包括角色的头发颜色和服...最新AI资源# AI图像风格控制# AI开源项目10个月前023.9K
Napkins.dev:基于Llama4上传线框图生成前端代码综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...最新AI资源# AI开源项目# AI页面设计6个月前023.8K
KBLaM:为大模型嵌入外部知识的开源增强工具综合介绍 KBLaM 是微软开发的一个开源项目,全称是“Knowledge Base augmented Language Model”(知识库增强语言模型)。它通过将外部知识转化为向量并嵌入大模型的...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前023.8K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架9个月前023.8K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天综合介绍 OpenAOE 是一个开源的大模型群聊框架,旨在解决当前市场上缺乏多模型并行响应的聊天框架的问题。通过 OpenAOE,用户可以同时与多个大语言模型(LLM)进行对话,获取并行输出。该框架支...最新AI资源# AI开源项目# AI集成多模型对话平台8个月前023.8K
AutoDev:支持多语言的自动代码生成与调试工具综合介绍 AutoDev 是一个由 Unit Mesh 团队开发的开源项目,托管在 GitHub 上,旨在通过人工智能技术提升开发者的编程效率。它是一个功能强大的编码助手,支持多种编程语言,包括 Ja...最新AI资源# AI开源项目# AI编程8个月前023.8K
ACI.DEV:通过MCP服务器为AI智能体集成600+工具综合介绍 ACI.dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、S...最新AI资源# AI开源项目# MCP服务5个月前023.8K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务7个月前023.8K
VirtualWife:支持B站直播和语音互动的二次元数字人综合介绍 VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播...最新AI资源# AI开源项目# AI数字人7个月前023.8K
DiffBIR:提升图像质量的智能修复工具综合介绍 DiffBIR(Blind Image Restoration with Generative Diffusion Prior)是一个由XPixelGroup开发的图像修复工具,旨在通过生成...最新AI资源# AI图像放大与修复# AI开源项目9个月前023.8K
自动爬取小说并生成多角色有声书的工具综合介绍 Auto-Audio-Book 是一个开源项目,托管在 GitHub 上。它能自动从网站爬取小说内容,并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...最新AI资源# AI副业赚钱项目# AI开源项目7个月前023.8K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具,旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎,包括Google Translate、Microsoft Tra...最新AI资源# AI开源项目# AI翻译8个月前023.8K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交综合介绍 Melty是一款革命性的AI代码编辑器,它将聊天对话与Git版本控制完美结合。由来自Replicate的Charlie和Jackson共同开发,这款工具旨在解决传统AI编码工具的痛点。其最大...最新AI资源# AI开源项目# AI编程10个月前023.7K
Describe Anything:为图像和视频区域生成详细描述的开源工具综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的...最新AI资源# AI开源项目# 视觉目标检测5个月前023.7K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆1年前023.7K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况综合介绍 ChatGPT 服务降级监测工具是一个开源项目,旨在帮助用户检测其 ChatGPT 服务是否因高风险 IP 而被降级。该工具通过分析 Proof of Work (PoW) 难度值,判断用户...最新AI资源# AI开源项目10个月前023.7K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新综合介绍 GitPodcast 是一个创新的工具,旨在将 GitHub 仓库转化为播客,让开发者可以随时随地收听代码更新。通过使用 OpenAI 和 Azure Speech SDK,GitPodca...最新AI资源# AI开源项目# AI文本与音频/视频总结工具9个月前023.7K
Rankify:支持信息检索与重排序的Python工具包综合介绍 Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成(RAG),提供了一个统一的框架。工具包内置 40 个预检索基准数...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前023.7K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架综合介绍 AIEditor 是一个由 AI 驱动的下一代富文本编辑器,基于 Web Component 开发,支持 Vue、React、Angular 等几乎所有主流前端框架。它兼容 PC Web 和...最新AI资源# AI写作# AI开源项目10个月前023.7K
csm-mlx:苹果设备专用的 csm 语音生成模型综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用...最新AI资源# AI开源项目# AI文本转语音7个月前023.7K
ANUS:任务自动化与多代理协作的开源 AI 框架综合介绍 ANUS(Advanced Neural Understanding System,高级神经理解系统)是一个托管在 GitHub 上的开源 AI 代理框架,由用户 nikmcfly 通过提示...最新AI资源# AI开源项目# 智能体开发框架7个月前023.7K
Lux:几乎支持所有视频平台的命令行视频下载器综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频,包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能,如多线程下载...最新AI资源# AI开源项目9个月前023.7K