WebPilot:智能网页信息处理工具,网页内容抓取免费APIWebPilot 综合介绍 Webpilot是一个免费开源的“网页助手”,它可以让你和任何网页进行自由交流,或者执行自动任务。你不需要切换网页或者复制粘贴,只需要选择文本或者输入指令,webpilot...最新AI资源# AI开放服务# AI开源项目# AI搜索工具2年前063.9K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程1年前063.9K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自...最新AI资源# AI开源项目# 桌面自动化智能体1年前063.9K
Langui:开源的AI用户界面组件库综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...最新AI资源# AI开源项目# AI页面设计1年前063.9K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用1年前063.8K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗1年前063.8K
在 Cloudflare Workers 中快速部署 MCP 服务综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目,托管于 GitHub,旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的...最新AI资源# AI开源项目# MCP服务1年前063.8K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架1年前063.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架综合介绍 OpenAI Agents SDK 是 OpenAI 推出的一款轻量级开发工具,专为构建多智能体工作流设计。它基于 Python,简单易上手,支持开发者通过配置智能体(Agents)、任务切...最新AI资源# AI开源项目# 智能体开发框架1年前063.7K
WritingBench:测试大模型写作能力的基准评估工具综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目,托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具,提供了 1239 个真实世界的写作任务。这些任务覆盖 ...最新AI资源# AI开源项目1年前063.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前063.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新AI资源# AI开源项目# 视觉目标检测1年前063.7K
SmartRead:自动标注技术PDF文档并提供相关引用源综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主...最新AI资源# AI写作# AI开源项目# AI教育工具1年前063.7K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。项目托管在GitHub上...最新AI资源# AI开源项目# AI教育工具1年前063.6K
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI资源# AI开源项目1年前063.6K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像综合介绍 OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...最新AI资源# AI在线生成图像# AI开源项目1年前063.6K
AgentGPT:创建并运行自动化AI智能体的开源项目综合介绍 AgentGPT 是一个由 Reworkd 团队开发的开源项目,托管在 GitHub 上,旨在让用户通过浏览器自主创建、配置和部署 AI 智能体。用户只需设定一个目标,AgentGPT 就能...最新AI资源# AI开源项目# 智能体开发框架1年前063.5K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目1年前063.5K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码综合介绍 Devika是一个先进的AI软件工程师,能够理解高阶人类指令,将其分解为步骤,研究相关信息,并编写代码以实现给定的目标。它利用大型语言模型、规划和推理算法以及网页浏览能力,智能地开发软件。D...最新AI资源# AI开源项目# AI编程# 智能体应用1年前063.5K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具,旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来,利用先进的机器学习模型,能...最新AI资源# AI图像生成辅助工具# AI开源项目1年前063.5K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...最新AI资源# AI开源项目1年前063.5K
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...最新AI资源# AI开源项目# 大模型微调1年前063.5K
AI Chatbot:Vercel 构建和部署智能聊天机器人综合介绍 AI Chatbot 是一个由 Vercel 开发的开源项目,旨在帮助开发者快速构建和部署智能聊天机器人。该项目基于 Next.js 框架,并集成了多种 AI 模型提供商,如 OpenAI...最新AI资源# AI开源项目# AI本地化聊天应用1年前063.5K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新AI资源# AI开源项目1年前063.4K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务综合介绍 Basic Memory 是一个通过与AI助手(如Claude)对话来构建知识图谱的工具。它由 Basic Machines 公司开发,核心特点是把对话内容保存为 Markdown 文件,存...最新AI资源# AI开源项目# MCP服务# 知识图谱1年前063.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具,专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型,利用自然语言交互的方式,让用户能够轻松查询、操...最新AI资源# AI开源项目# AI数据分析1年前063.4K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI资源# AI开源项目# 文档提取与清洗1年前063.3K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具综合介绍 Feeds.Fun 是一个帮助用户高效阅读新闻的工具,核心特点是自动为新闻添加标签并根据用户喜好筛选内容。它由开发者 Aliaksei Yaletski(网名 Tiendil)创建,托管在 ...最新AI资源# AI开源项目# AI生活效率助手1年前063.3K
Zed:Rust开发的高性能多人协作代码编辑器综合介绍 Zed 是由 Atom 和 Tree-sitter 的创造者开发的一款高性能、多用户协作的代码编辑器。Zed 采用 Rust 语言编写,旨在提供快速、流畅的编码体验。其主要特点包括支持多人实...最新AI资源# AI IDE# AI开源项目# AI编程1年前063.3K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前063.3K
Agent Inbox:与AI智能体进行人机交互的管理界面综合介绍 Agent Inbox是由LangChain团队开发的一个开源项目,旨在提供一种新的用户体验,用于与AI智能体进行交互。该项目允许用户通过一个集中的界面管理和优化与多个AI智能体的交互。Ag...最新AI资源# AI开源项目1年前063.2K
AIBot PRO:集成多种AI产品的商业化聚合平台综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端,旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话,集成了ChatGPT、Gemini、Claude、文心一言...最新AI资源# AI副业赚钱项目# AI开源项目# AI集成多模型对话平台1年前063.1K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆2年前063.1K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前063.1K
Open Deep Research:生成基于网络搜索内容的AI研究报告综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具,作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发,基于Next.js 1...最新AI资源# AI开源项目# 生成深度研究报告1年前063K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装1年前063K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能,帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户,能够处理...最新AI资源# AI开源项目# 知识图谱1年前063K
Deep Research Web UI:支持多语言深度研究的AI助手综合介绍 Deep Research Web UI 是一个基于AI技术的开源研究助手工具,旨在帮助用户对任何主题进行深度的迭代研究。它结合了搜索引擎、网页抓取和大型语言模型的能力,通过直观的Web界面...最新AI资源# AI开源项目# 生成深度研究报告1年前063K
sensitive-word:敏感词过滤工具,高效DFA算法实现综合介绍 敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供...最新AI资源# AI开源项目2年前062.9K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI资源# AI开源项目# AI教育工具# AI文本转视频1年前062.9K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows...最新AI资源# AI开源项目# AI语音克隆1年前062.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体...最新AI资源# AI开源项目# AI搜索工具1年前062.8K
MoBA: Kimi 推出的支持长上下文处理的大语言模型综合介绍 MoBA(Mixture of Block Attention)是由MoonshotAI开发的一种创新注意力机制,专为长上下文处理的大语言模型(LLMs)设计。MoBA通过将全上下文划分为多...最新AI资源# AI开源项目1年前062.8K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API1年前062.8K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章综合介绍 Paper Reviewer 是一个开源项目,旨在从 arXiv 论文生成综合评审,并将其转化为博客文章。该项目为 Hugging Face 的 Daily Papers 网站提供支持,自动...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前062.7K
RLAMA:命令行操作的本地文档智能问答 RAG 系统综合介绍 RLAMA 是一个由 DonTizi 开源开发并托管于 GitHub 的文档智能问答 RAG(检索增强生成)系统,其核心特色在于通过命令行操作实现功能。用户可以通过简洁的终端命令,连接本地 ...最新AI资源# AI开源项目# 知识检索与RAG框架1年前062.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型综合介绍 Step-Video-T2V是由StepFun AI(阶跃星辰)推出的一款先进的文本到视频转换模型。该模型拥有30亿参数,能够生成长达204帧的视频。通过深度压缩变分自编码器(VAE),模型...最新AI资源# AI开源项目# AI文本转视频1年前062.6K
MiniMind-V:1小时训练26M参数视觉语言模型综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...最新AI资源# AI开源项目# 大模型微调12个月前062.6K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目,旨在通过频率分解技术实现身份一致的文本到视频生成(IPT2V)。该项目的核心是一个基于DiT(Diffusion Transfor...最新AI资源# AI开源项目# AI文本转视频1年前062.5K
XRAG:优化检索增强生成系统的可视化评估工具综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...最新AI资源# AI开源项目# 知识检索与RAG框架1年前062.5K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)综合介绍 Flashcard是一个开源的语言学习工具,旨在提供一个替代Duolingo的解决方案。该项目由Steven Lynn(GitHub用户名:stvlynn)开发,采用现代化的用户界面和多语言...最新AI资源# AI开源项目# AI教育工具1年前062.5K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...最新AI资源# AI开源项目1年前062.5K
KBLaM:为大模型嵌入外部知识的开源增强工具综合介绍 KBLaM 是微软开发的一个开源项目,全称是“Knowledge Base augmented Language Model”(知识库增强语言模型)。它通过将外部知识转化为向量并嵌入大模型的...最新AI资源# AI开源项目# 知识检索与RAG框架1年前062.5K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具综合介绍 AnimatedDrawings 是由 Facebook Research 开发的一个开源项目,旨在通过自动化技术将儿童的绘画作品转化为动画角色。该项目基于论文《A Method for A...最新AI资源# AI图像转视频# AI开源项目# AI涂鸦生成绘画1年前062.4K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新AI资源# AI开源项目# OCR# 免费大模型API1年前062.4K
STAR:空间时序增强AI模型,提升视频分辨率清晰度综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...最新AI资源# AI图像放大与修复# AI开源项目1年前062.4K
基于Qdrant向量搜索引擎构建的MCP服务综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...最新AI资源# AI开源项目# MCP服务1年前062.4K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格综合介绍 Maxun是一个开源的无代码网页数据提取平台,用户可以在几分钟内训练机器人,自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动,能够适应网站布局的变化,提供强大的数据抓取功能...最新AI资源# AI开源项目# 文档提取与清洗1年前062.3K
Novel:模仿Notion AI的开源写作编辑器综合介绍 这是一个由Steven Tey开发的开源项目,名为Novel,它是一个Notion风格的所见即所得文本编辑器,集成了AI自动补全功能,可助力用户提升文字输入效率。项目提供了详尽的文档和安装指...最新AI资源# AI写作# AI开源项目2年前062.3K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建,旨在通过收集和处理来自 YouTube 的说唱歌曲,为研究人员和开发者提供一个高质量的说唱歌词数据...最新AI资源# AI开源项目# AI音乐1年前062.3K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体综合介绍 Clevrr Computer 是一个开源项目,旨在通过使用 PyAutoGUI 库来实现系统操作的自动化。该项目受到 Anthropic 的启发,设计了一个自动化代理,可以精确高效地执行用...最新AI资源# AI开源项目# 桌面自动化智能体1年前062.3K
DiffBIR:提升图像质量的智能修复工具综合介绍 DiffBIR(Blind Image Restoration with Generative Diffusion Prior)是一个由XPixelGroup开发的图像修复工具,旨在通过生成...最新AI资源# AI图像放大与修复# AI开源项目1年前062.3K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫...最新AI资源# AI开源项目1年前062.3K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前062.3K
Kreuzberg:从任何文档中提取文本的开源工具综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generatio...最新AI资源# AI开源项目# 文档提取与清洗1年前062.2K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口综合介绍 simple-one-api 是一个开源项目,旨在简化多种大模型API的集成。它支持千帆大模型平台、讯飞星火大模型、腾讯混元以及 MiniMax 和 Deep-Seek 等兼容 OpenAI...最新AI资源# AI开源项目1年前062.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI资源# AI开源项目# AI数字人1年前062.1K
PicMenu:文字菜单转换为美观的图文菜单综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型...最新AI资源# AI开源项目1年前062.1K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息综合介绍 MCP Server ChatSum 是一个开源项目,旨在帮助用户查询和总结聊天消息。该项目托管在 GitHub 上,提供了一个强大的工具集,允许用户根据特定参数查询聊天记录,并生成相应的总...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# MCP服务1年前062K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成...最新AI资源# AI开源项目# AI本地化聊天应用1年前062K
Coding Agent:基于Langgraph构建的简单编程助手综合介绍 Coding Agent 是一个由 AbhinavTheDev 开发的智能编程助手,旨在帮助开发者提高编程效率。该工具利用人工智能技术,能够自动生成代码、提供编程建议,并协助开发者完成各种编...最新AI资源# AI开源项目# AI编程1年前062K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI资源# AI图像风格控制# AI开源项目1年前061.8K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体1年前061.8K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测综合介绍 Forecast AI 是一个基于先进人工智能技术的超级预测平台。它利用强大的数据分析和机器学习算法,为用户提供高精度的未来事件预测。无论是政治选举、经济趋势还是社会事件,Forecast ...最新AI资源# AI开源项目# AI搜索工具2年前061.8K
csm-mlx:苹果设备专用的 csm 语音生成模型综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用...最新AI资源# AI开源项目# AI文本转语音1年前061.8K
DocAgent:自动生成Python代码文档的智能工具综合介绍 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析,自动为 Python 代码库生成高质量、上下文感知的文档注释(d...最新AI资源# AI开源项目12个月前061.8K
Dolphin:面向亚洲语言识别与语音转文本模型综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型,专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言,以及 22 种中国方言...最新AI资源# AI开源项目# AI语音转文本1年前061.8K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人综合介绍 DeepSeek-RAG-Chatbot 是一个基于 DeepSeek R1 模型构建的开源聊天机器人项目,托管于 GitHub,由开发者 SaiAkhil066 创建。它结合了检索增强生成...最新AI资源# AI开源项目# 知识检索与RAG框架1年前061.7K
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...最新AI资源# AI开源项目# 大模型微调# 桌面自动化智能体1年前061.7K
DCT-Net:照片和视频转绘为动漫风格化的开源工具综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目,旨在实现图像的动漫风格化转换。该项目利用深度学习技术,通过域校准翻译(Domain-Calibrat...最新AI资源# AI图像风格控制# AI开源项目# AI视频转换风格1年前061.7K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...最新AI资源# AI开源项目# 多模态实时互动产品1年前061.7K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...最新AI资源# AI开源项目# MCP服务11个月前061.7K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...最新AI资源# AI开源项目# 多模态实时互动产品1年前061.7K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目,它能从一张图片快速生成包含多个物体的3D场景,适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...最新AI资源# AI开源项目# AI文本与图片转3D1年前061.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生...最新AI资源# AI图像风格控制# AI开源项目1年前061.7K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版综合介绍 pdf2htmlEX 是一个开源工具,旨在将 PDF 文件转换为 HTML 格式,通过分析 PDF 文件的内容并使用 HTML + CSS 精确还原其视觉效果, 将 PDF 文档转换为浏览器...最新AI资源# AI开源项目# 文档提取与清洗1年前061.6K
Agenta:集成到AI应用的提示词与模型效果评估工具综合介绍 Agenta 是一个开源的AI模型管理工具,专门帮助用户轻松实验提示词、测试模型效果和监控运行情况。它适合想快速开发AI应用的人,提供了一个简单操作的平台。你可以用它试试不同提示词的效果,对...最新AI资源# AI开源项目# PROMPTS辅助工具1年前061.6K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新AI资源# AI开源项目# prompt越狱1年前061.5K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架综合介绍 AIEditor 是一个由 AI 驱动的下一代富文本编辑器,基于 Web Component 开发,支持 Vue、React、Angular 等几乎所有主流前端框架。它兼容 PC Web 和...最新AI资源# AI写作# AI开源项目1年前061.5K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一...最新AI资源# AI图像放大与修复# AI开源项目1年前061.5K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库综合介绍 Taipy 是由 Avaiga 开发的一个强大的 Python 库,专为数据科学家和机器学习工程师设计,用于快速构建和部署数据驱动的 Web 应用程序。Taipy 提供了一整套工具和组件,使...最新AI资源# AI开源项目# AI数据分析1年前061.5K
Awesome AI Agents:收集150+AI智能体框架的资源集合综合介绍 Awesome AI Agents 是一个由 e2b-dev 团队维护的 GitHub 开源项目,专注于收集和整理与自主 AI 智能体相关的资源。这个项目汇集了超过 150 种 AI 智能体...最新AI资源# AI开源项目1年前061.5K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI资源# AI开源项目# AI数字人1年前061.5K
Quick Prompt:快速管理和使用提示词的浏览器扩展综合介绍 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...最新AI资源# AI开源项目# PROMPTS辅助工具11个月前061.4K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件综合介绍 MarkPDFDown 是一个开源工具。它利用多模态大语言模型,把 PDF 文件转为 Markdown 格式。开发者是 GitHub 用户 jorben。这个工具的目标很简单:让 PDF 文...最新AI资源# AI开源项目# 文档提取与清洗1年前061.4K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单...最新AI资源# AI开源项目# AI文本转语音1年前061.4K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权综合介绍 VideoSeal是由Facebook Research开发的开源视频水印工具,旨在提供高效的视频水印嵌入与提取功能。该工具支持最新的开源模型,包含预训练模型、训练代码、推理代码和评估工具...最新AI资源# AI开源项目# AI音视频编辑1年前061.4K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic...最新AI资源# AI开源项目# AI数字人1年前061.4K
ReCamMaster:从单一视频生成多视角视频的渲染工具综合介绍 ReCamMaster 是一个开源视频处理工具,核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹,重新渲染视频,获得不同角度的动态画面。它由浙江大学、快手科技等团队开发,基于文本到...最新AI资源# AI开源项目# AI视频转换风格1年前061.4K