CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程1年前069.6K
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI资源# AI开源项目# MCP服务1年前069.6K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客...最新AI资源# AI开源项目1年前069.5K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成综合介绍 PandasAI是一个基于Python的开源平台,旨在通过自然语言处理技术简化数据分析过程。使用户能够以对话的方式与数据库(如 SQL、CSV、pandas、polars、mongodb、n...最新AI资源# AI开源项目# AI数据分析2年前069.5K
Deep Recall:为大模型提供企业级记忆框架的开源工具综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...最新AI资源# AI开源项目# 知识检索与RAG框架1年前069.5K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目,旨在通过频率分解技术实现身份一致的文本到视频生成(IPT2V)。该项目的核心是一个基于DiT(Diffusion Transfor...最新AI资源# AI开源项目# AI文本转视频2年前069.5K
TangoFlux:快速文本到配音转换工具,3秒钟生成30秒长音频综合介绍 TangoFlux 是一个由 DeCLaRe Lab 开发的高效文本到音频(TTA)生成模型。该模型能够在短短 3.7 秒内生成长达 30 秒的 44.1kHz 立体声音频。TangoFlu...最新AI资源# AI开源项目# AI音乐1年前069.5K
TableGPT Agent:专为分析复杂表格数据设计的智能工具综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具,专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型,利用自然语言交互的方式,让用户能够轻松查询、操...最新AI资源# AI开源项目# AI数据分析1年前069.4K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务综合介绍 Basic Memory 是一个通过与AI助手(如Claude)对话来构建知识图谱的工具。它由 Basic Machines 公司开发,核心特点是把对话内容保存为 Markdown 文件,存...最新AI资源# AI开源项目# MCP服务# 知识图谱1年前069.4K
SmartRead:自动标注技术PDF文档并提供相关引用源综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主...最新AI资源# AI写作# AI开源项目# AI教育工具1年前069.4K
AI Chatbot:Vercel 构建和部署智能聊天机器人综合介绍 AI Chatbot 是一个由 Vercel 开发的开源项目,旨在帮助开发者快速构建和部署智能聊天机器人。该项目基于 Next.js 框架,并集成了多种 AI 模型提供商,如 OpenAI...最新AI资源# AI开源项目# AI本地化聊天应用2年前069.4K
StarVector:从图像和文字生成SVG矢量图的基础模型综合介绍 StarVector 是一个开源项目,它由 Juan A. Rodriguez 等开发者创建,目的是将图像和文字转化为可缩放矢量图形(SVG)。这个工具使用视觉语言模型,能够理解图像内容和文...最新AI资源# AI图像风格控制# AI开源项目1年前069.4K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体...最新AI资源# AI开源项目# AI搜索工具1年前069.3K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令,比如“宗介开紫色车兜风”,生成动漫视频,还能让不同动漫角色互动,比如《魔女宅急便》的琪琪和《天空之城...最新AI资源# AI开源项目# AI视频生成工具# AI视频转换风格1年前069.3K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单...最新AI资源# AI开源项目# AI文本转语音1年前069.2K
Paper2Code:将机器学习论文自动转化为可运行代码综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...最新AI资源# AI开源项目# 智能体应用1年前069.2K
Langui:开源的AI用户界面组件库综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...最新AI资源# AI开源项目# AI页面设计1年前069.2K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新AI资源# AI开源项目# OCR2年前069.2K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗1年前069.1K
WritingBench:测试大模型写作能力的基准评估工具综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目,托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具,提供了 1239 个真实世界的写作任务。这些任务覆盖 ...最新AI资源# AI开源项目1年前069.1K
XRAG:优化检索增强生成系统的可视化评估工具综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...最新AI资源# AI开源项目# 知识检索与RAG框架1年前069.1K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架综合介绍 OpenAI Agents SDK 是 OpenAI 推出的一款轻量级开发工具,专为构建多智能体工作流设计。它基于 Python,简单易上手,支持开发者通过配置智能体(Agents)、任务切...最新AI资源# AI开源项目# 智能体开发框架1年前069.1K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆2年前069.1K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成...最新AI资源# AI开源项目# AI本地化聊天应用1年前069K
STAR:空间时序增强AI模型,提升视频分辨率清晰度综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...最新AI资源# AI图像放大与修复# AI开源项目1年前069K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI资源# AI开源项目# 文档提取与清洗2年前069K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前068.9K
WebPilot:智能网页信息处理工具,网页内容抓取免费APIWebPilot 综合介绍 Webpilot是一个免费开源的“网页助手”,它可以让你和任何网页进行自由交流,或者执行自动任务。你不需要切换网页或者复制粘贴,只需要选择文本或者输入指令,webpilot...最新AI资源# AI开放服务# AI开源项目# AI搜索工具2年前068.9K
RLAMA:命令行操作的本地文档智能问答 RAG 系统综合介绍 RLAMA 是一个由 DonTizi 开源开发并托管于 GitHub 的文档智能问答 RAG(检索增强生成)系统,其核心特色在于通过命令行操作实现功能。用户可以通过简洁的终端命令,连接本地 ...最新AI资源# AI开源项目# 知识检索与RAG框架1年前068.9K
AIBot PRO:集成多种AI产品的商业化聚合平台综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端,旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话,集成了ChatGPT、Gemini、Claude、文心一言...最新AI资源# AI副业赚钱项目# AI开源项目# AI集成多模型对话平台1年前068.8K
MoBA: Kimi 推出的支持长上下文处理的大语言模型综合介绍 MoBA(Mixture of Block Attention)是由MoonshotAI开发的一种创新注意力机制,专为长上下文处理的大语言模型(LLMs)设计。MoBA通过将全上下文划分为多...最新AI资源# AI开源项目1年前068.8K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用1年前068.8K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目1年前068.8K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新AI资源# AI开源项目# OCR# 免费大模型API2年前068.7K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码综合介绍 Devika是一个先进的AI软件工程师,能够理解高阶人类指令,将其分解为步骤,研究相关信息,并编写代码以实现给定的目标。它利用大型语言模型、规划和推理算法以及网页浏览能力,智能地开发软件。D...最新AI资源# AI开源项目# AI编程# 智能体应用1年前068.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具,旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来,利用先进的机器学习模型,能...最新AI资源# AI图像生成辅助工具# AI开源项目2年前068.7K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API1年前068.6K
在 Cloudflare Workers 中快速部署 MCP 服务综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目,托管于 GitHub,旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的...最新AI资源# AI开源项目# MCP服务1年前068.6K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...最新AI资源# AI开源项目1年前068.6K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows...最新AI资源# AI开源项目# AI语音克隆2年前068.5K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)综合介绍 Flashcard是一个开源的语言学习工具,旨在提供一个替代Duolingo的解决方案。该项目由Steven Lynn(GitHub用户名:stvlynn)开发,采用现代化的用户界面和多语言...最新AI资源# AI开源项目# AI教育工具1年前068.5K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用2年前068.5K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章综合介绍 Paper Reviewer 是一个开源项目,旨在从 arXiv 论文生成综合评审,并将其转化为博客文章。该项目为 Hugging Face 的 Daily Papers 网站提供支持,自动...最新AI资源# AI开源项目# AI文本与音频/视频总结工具2年前068.5K
sensitive-word:敏感词过滤工具,高效DFA算法实现综合介绍 敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供...最新AI资源# AI开源项目2年前068.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理...最新AI资源# AI开源项目1年前068.4K
Zed:Rust开发的高性能多人协作代码编辑器综合介绍 Zed 是由 Atom 和 Tree-sitter 的创造者开发的一款高性能、多用户协作的代码编辑器。Zed 采用 Rust 语言编写,旨在提供快速、流畅的编码体验。其主要特点包括支持多人实...最新AI资源# AI IDE# AI开源项目# AI编程2年前068.4K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告1年前068.4K
Open Deep Research:生成基于网络搜索内容的AI研究报告综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具,作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发,基于Next.js 1...最新AI资源# AI开源项目# 生成深度研究报告1年前068.3K
Deep Research Web UI:支持多语言深度研究的AI助手综合介绍 Deep Research Web UI 是一个基于AI技术的开源研究助手工具,旨在帮助用户对任何主题进行深度的迭代研究。它结合了搜索引擎、网页抓取和大型语言模型的能力,通过直观的Web界面...最新AI资源# AI开源项目# 生成深度研究报告1年前068.3K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新AI资源# AI开源项目1年前068.3K
Awesome AI Agents:收集150+AI智能体框架的资源集合综合介绍 Awesome AI Agents 是一个由 e2b-dev 团队维护的 GitHub 开源项目,专注于收集和整理与自主 AI 智能体相关的资源。这个项目汇集了超过 150 种 AI 智能体...最新AI资源# AI开源项目1年前068.2K
Agent Inbox:与AI智能体进行人机交互的管理界面综合介绍 Agent Inbox是由LangChain团队开发的一个开源项目,旨在提供一种新的用户体验,用于与AI智能体进行交互。该项目允许用户通过一个集中的界面管理和优化与多个AI智能体的交互。Ag...最新AI资源# AI开源项目1年前068.2K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像综合介绍 OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...最新AI资源# AI在线生成图像# AI开源项目2年前068.2K
DiffBIR:提升图像质量的智能修复工具综合介绍 DiffBIR(Blind Image Restoration with Generative Diffusion Prior)是一个由XPixelGroup开发的图像修复工具,旨在通过生成...最新AI资源# AI图像放大与修复# AI开源项目1年前068.2K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具综合介绍 Feeds.Fun 是一个帮助用户高效阅读新闻的工具,核心特点是自动为新闻添加标签并根据用户喜好筛选内容。它由开发者 Aliaksei Yaletski(网名 Tiendil)创建,托管在 ...最新AI资源# AI开源项目# AI生活效率助手1年前068.2K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一...最新AI资源# AI图像放大与修复# AI开源项目1年前068.1K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装1年前068K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口综合介绍 simple-one-api 是一个开源项目,旨在简化多种大模型API的集成。它支持千帆大模型平台、讯飞星火大模型、腾讯混元以及 MiniMax 和 Deep-Seek 等兼容 OpenAI...最新AI资源# AI开源项目2年前068K
MiniMind-V:1小时训练26M参数视觉语言模型综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...最新AI资源# AI开源项目# 大模型微调1年前068K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...最新AI资源# AI开源项目# MCP服务1年前068K
Quick Prompt:快速管理和使用提示词的浏览器扩展综合介绍 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...最新AI资源# AI开源项目# PROMPTS辅助工具1年前067.8K
KBLaM:为大模型嵌入外部知识的开源增强工具综合介绍 KBLaM 是微软开发的一个开源项目,全称是“Knowledge Base augmented Language Model”(知识库增强语言模型)。它通过将外部知识转化为向量并嵌入大模型的...最新AI资源# AI开源项目# 知识检索与RAG框架1年前067.8K
agent-twitter-client:无需Twitter API密钥,发送、转发推文综合介绍 agent-twitter-client是一个无需Twitter API密钥即可使用的Twitter客户端。该项目基于@the-convocation/twitter-scraper进行了修...最新AI资源# AI开源项目# AI社交媒体1年前067.8K
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...最新AI资源# AI开源项目# 大模型微调# 桌面自动化智能体1年前067.8K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前067.7K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新AI资源# AI开源项目# prompt越狱1年前067.7K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格综合介绍 Maxun是一个开源的无代码网页数据提取平台,用户可以在几分钟内训练机器人,自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动,能够适应网站布局的变化,提供强大的数据抓取功能...最新AI资源# AI开源项目# 文档提取与清洗1年前067.7K
PicMenu:文字菜单转换为美观的图文菜单综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型...最新AI资源# AI开源项目2年前067.6K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫...最新AI资源# AI开源项目2年前067.6K
UniAPI:免服务器统一管理大模型API转发综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器,核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API,比如 OpenAI、Azure OpenAI、Clau...最新AI资源# AI开源项目1年前067.6K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI资源# AI图像风格控制# AI开源项目1年前067.6K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能,帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户,能够处理...最新AI资源# AI开源项目# 知识图谱1年前067.6K
csm-mlx:苹果设备专用的 csm 语音生成模型综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用...最新AI资源# AI开源项目# AI文本转语音1年前067.6K
Dolphin:面向亚洲语言识别与语音转文本模型综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型,专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言,以及 22 种中国方言...最新AI资源# AI开源项目# AI语音转文本1年前067.5K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI资源# AI开源项目# 文档提取与清洗2年前067.5K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体1年前067.5K
Coding Agent:基于Langgraph构建的简单编程助手综合介绍 Coding Agent 是一个由 AbhinavTheDev 开发的智能编程助手,旨在帮助开发者提高编程效率。该工具利用人工智能技术,能够自动生成代码、提供编程建议,并协助开发者完成各种编...最新AI资源# AI开源项目# AI编程1年前067.4K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI资源# AI开源项目# AI文本与音频/视频总结工具2年前067.4K
Kreuzberg:从任何文档中提取文本的开源工具综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generatio...最新AI资源# AI开源项目# 文档提取与清洗1年前067.4K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具综合介绍 AnimatedDrawings 是由 Facebook Research 开发的一个开源项目,旨在通过自动化技术将儿童的绘画作品转化为动画角色。该项目基于论文《A Method for A...最新AI资源# AI图像转视频# AI开源项目# AI涂鸦生成绘画1年前067.4K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型综合介绍 Step-Video-T2V是由StepFun AI(阶跃星辰)推出的一款先进的文本到视频转换模型。该模型拥有30亿参数,能够生成长达204帧的视频。通过深度压缩变分自编码器(VAE),模型...最新AI资源# AI开源项目# AI文本转视频1年前067.4K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic...最新AI资源# AI开源项目# AI数字人1年前067.3K
Novel:模仿Notion AI的开源写作编辑器综合介绍 这是一个由Steven Tey开发的开源项目,名为Novel,它是一个Notion风格的所见即所得文本编辑器,集成了AI自动补全功能,可助力用户提升文字输入效率。项目提供了详尽的文档和安装指...最新AI资源# AI写作# AI开源项目2年前067.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权综合介绍 VideoSeal是由Facebook Research开发的开源视频水印工具,旨在提供高效的视频水印嵌入与提取功能。该工具支持最新的开源模型,包含预训练模型、训练代码、推理代码和评估工具...最新AI资源# AI开源项目# AI音视频编辑1年前067.3K
基于Qdrant向量搜索引擎构建的MCP服务综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...最新AI资源# AI开源项目# MCP服务1年前067.3K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...最新AI资源# AI开源项目# 多模态实时互动产品1年前067.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识综合介绍 Search-o1 是一个开源项目,旨在通过整合高级搜索机制来增强大规模推理模型(LRMs)的性能。其核心思想是通过动态的搜索和知识整合来解决推理过程中遇到的知识缺失问题。该项目由 sunn...最新AI资源# AI开源项目# AI搜索工具1年前067.2K
FoleyCrafter:为无声视频添加生动同步的音效综合介绍 FoleyCrafter 是一个由 OpenMMLab 开发的开源项目,旨在为无声视频生成生动且同步的音效。该项目利用先进的人工智能技术,通过分析视频内容,生成与之语义相关且时间同步的音效...最新AI资源# AI开源项目# AI音乐1年前067.2K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...最新AI资源# AI开源项目# 文档提取与清洗1年前067.1K
Coding-Tutor:提供个性化编程指导的智能教学助手综合介绍 Coding-Tutor 是一个托管在 GitHub 上的开源项目,由开发者 iwangjian 创建,旨在为学习者提供个性化的编程教学体验。它通过对话式人工智能技术,根据用户的知识背景和学...最新AI资源# AI开源项目# AI教育工具1年前067.1K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台,专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型,包括基于扩散和自回归的世界...最新AI资源# AI开放服务# AI开源项目1年前067.1K
Plandex:支持超长上下文的开源AI编码助手综合介绍 Plandex 是一个开源的终端 AI 编码助手,专为大型复杂软件项目设计。它能规划和执行多步骤任务,处理高达 200 万 token 的上下文,支持 30 多种编程语言。Plandex 提...最新AI资源# AI开源项目# AI编程1年前067.1K
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI资源# AI开源项目# AI数字人1年前067.1K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体综合介绍 Clevrr Computer 是一个开源项目,旨在通过使用 PyAutoGUI 库来实现系统操作的自动化。该项目受到 Anthropic 的启发,设计了一个自动化代理,可以精确高效地执行用...最新AI资源# AI开源项目# 桌面自动化智能体1年前067K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI资源# AI开源项目# AI数字人2年前067K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版综合介绍 pdf2htmlEX 是一个开源工具,旨在将 PDF 文件转换为 HTML 格式,通过分析 PDF 文件的内容并使用 HTML + CSS 精确还原其视觉效果, 将 PDF 文档转换为浏览器...最新AI资源# AI开源项目# 文档提取与清洗2年前066.9K
ell:轻量级函数式提示词工程框架综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化...最新AI资源# AI开源项目# PROMPTS辅助工具1年前066.9K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人综合介绍 DeepSeek-RAG-Chatbot 是一个基于 DeepSeek R1 模型构建的开源聊天机器人项目,托管于 GitHub,由开发者 SaiAkhil066 创建。它结合了检索增强生成...最新AI资源# AI开源项目# 知识检索与RAG框架1年前066.9K
Agenta:集成到AI应用的提示词与模型效果评估工具综合介绍 Agenta 是一个开源的AI模型管理工具,专门帮助用户轻松实验提示词、测试模型效果和监控运行情况。它适合想快速开发AI应用的人,提供了一个简单操作的平台。你可以用它试试不同提示词的效果,对...最新AI资源# AI开源项目# PROMPTS辅助工具1年前066.9K