Sim Studio:开源的AI代理工作流构建工具综合介绍 Sim Studio 是一个开源的 AI 代理工作流构建平台,专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型(LLM)工作流。用户无需深入编程即可通过拖拽方式创建复...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架3个月前01.2K
Mad Professor:辅助阅读和分析学术论文的AI工具综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...最新AI资源# AI开源项目# AI教育工具3个月前01K
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API综合介绍 AIstudioProxyAPI 是一个开源项目,使用 Node.js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的...最新AI资源# AI开源项目# 免费大模型API3个月前01.2K
Step1X-Edit:自然语言指令编辑图像的开源工具综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然...最新AI资源# AI图像编辑# AI开源项目3个月前0918
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...最新AI资源# AI开源项目# MCP服务3个月前01.2K
RealtimeVoiceChat:低延迟与AI进行自然口语对话综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...最新AI资源# AI开源项目# 多模态实时互动产品3个月前0798
MiMo:高效数学推理与代码生成的小型开源模型综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...最新AI资源# AI开源项目3个月前01.1K
Muyan-TTS:个性化播客语音训练与合成综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3...最新AI资源# AI开源项目# AI文本转语音3个月前01.1K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即...最新AI资源# AI开源项目# MCP服务3个月前01.2K
GraphGen:利用知识图谱生成合成数据微调语言模型综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...最新AI资源# AI开源项目# 大模型微调# 知识图谱3个月前0884
ACI.DEV:通过MCP服务器为AI智能体集成600+工具综合介绍 ACI.dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、S...最新AI资源# AI开源项目# MCP服务3个月前0910
llm.pdf:在PDF文件中运行大型语言模型的实验项目综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...最新AI资源# AI开源项目# 本地部署开源大模型工具3个月前0952
Abogen:将多种文本格式转换为有声读物的工具综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...最新AI资源# AI开源项目# AI语音转文本3个月前0947
Local Deep Research:本地运行的生成深度研究报告工具综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...最新AI资源# AI开源项目# 生成深度研究报告3个月前01.1K
Trackers:用于视频对象跟踪的开源工具库综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...最新AI资源# AI开源项目# 视觉目标检测3个月前01.2K
Kimi-Audio:开源音频处理与对话基础模型综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本3个月前0986
Describe Anything:为图像和视频区域生成详细描述的开源工具综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的...最新AI资源# AI开源项目# 视觉目标检测3个月前01K
Cooragent:一句话构建多智能体任务协作工具综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两...最新AI资源# AI开源项目# 智能体开发框架3个月前01K
InstantCharacter:从单张图片生成一致性角色的开源工具综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图...最新AI资源# AI图像风格控制# AI开源项目3个月前01.4K
Claude生成深度研究报告的MCP服务综合介绍 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度...最新AI资源# AI开源项目# MCP服务# 生成深度研究报告3个月前0861
Deep Recall:为大模型提供企业级记忆框架的开源工具综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...最新AI资源# AI开源项目# 知识检索与RAG框架3个月前0981
CleverBee:开源AI研究助手,生成引证研究报告综合介绍 CleverBee 是一个开源的 AI 研究助手,托管在 GitHub 上,由 SureScaleAI 开发。它通过大语言模型(如 Gemini 和 Claude)结合网页浏览技术,帮助用户...最新AI资源# AI开源项目# 生成深度研究报告3个月前01.1K
FantasyTalking:生成真实感说话肖像的开源工具综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1,结合音频编码器 Wa...最新AI资源# AI开源项目# AI数字人3个月前01.6K
Paper2Code:将机器学习论文自动转化为可运行代码综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...最新AI资源# AI开源项目# 智能体应用3个月前0950
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档综合介绍 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生...最新AI资源# AI开源项目3个月前01.5K
Audibit:将热门科技文章转为随时收听的音频播客综合介绍 Audibit 是一个开源项目,核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客,让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使...最新AI资源# AI开源项目# AI文本转语音3个月前0873
VoltAgent:快速构建AI智能体的TypeScript开源框架综合介绍 VoltAgent 是一个开源的 TypeScript 框架,专为开发者设计,帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式,简化了与大型语言模型(LLM)交互、状态...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架3个月前0914
Quick Prompt:快速管理和使用提示词的浏览器扩展综合介绍 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...最新AI资源# AI开源项目# PROMPTS辅助工具3个月前01.2K
Suna:集成浏览器操作与数据分析的智能代理综合介绍 Suna 是 Kortix AI 开发的一个开源通用 AI 代理,托管在 GitHub 上,基于 Apache 2.0 许可证,允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成...最新AI资源# AI开源项目# 桌面自动化智能体# 生成深度研究报告4个月前01.2K
InternVL:开源多模态大模型,支持图像、视频和文本处理综合介绍 InternVL 是由上海人工智能实验室(OpenGVLab)开发的一个开源多模态大模型项目,托管在 GitHub 上。它集成了视觉和语言处理能力,支持图像、视频和文本的综合理解与生成。In...最新AI资源# AI开源项目4个月前01.1K
roop-unleashed:基于Roop优化的全能换脸工具综合介绍 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具,继承自 s0md3v 的 Roop 项目,由开发者 C0untFloyd 继续维护并更名为 Roop-Unle...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸4个月前01.2K
Potpie AI:快速创建专属代码库的AI工程助手综合介绍 Potpie AI 是一个开源平台,专注于为开发者提供定制化的AI工程助手。它通过构建代码库的知识图谱,让AI代理深入理解代码结构与逻辑,自动化完成调试、测试、代码生成等任务。用户可以用简单...最新AI资源# AI开源项目# AI编程4个月前01.2K
Vexa:实时会议转录与智能知识提取工具综合介绍 Vexa 是一个开源的实时会议转录和知识管理平台,旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人,自动加入 Google Meet、Zoom 等平台...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI语音转文本4个月前01K
RooFlow:基于 Roo Code 扩展的记忆增强系统综合介绍 RooFlow 是一个开源的AI辅助编程工具,核心功能是通过项目记录保存开发过程中的代码、决策和任务进展。它基于Roo Code扩展,集成了五种模式:架构、编码、测试、调试和问答。这些模式互...最新AI资源# AI开源项目# AI编程4个月前0926
Zev:用自然语言快速查询终端命令的CLI工具综合介绍 Zev 是一个简单易用的命令行界面(CLI)工具,帮助用户通过自然语言快速查询和生成终端命令。用户无需记住复杂的命令语法,只需用日常语言描述需求,Zev 就能生成对应的终端命令。基于 Ope...最新AI资源# AI开源项目4个月前0588
Together Open Deep Research:生成带索引的深度研究报告综合介绍 Open Deep Research 是一个由 Together AI 团队开发并开源的深度研究工具,托管在 GitHub 上。它通过多代理人工智能工作流,模拟人类研究过程,生成详细的研究报...最新AI资源# AI开源项目# 生成深度研究报告4个月前0685
LLManager:智能自动化流程审批与人类审核结合的管理工具综合介绍 LLManager 是一个开源的智能审批管理工具,基于 LangChain 的 LangGraph 框架开发,专注于自动化处理审批请求,同时结合人类审核优化决策。它通过语义搜索、少样本学习和...最新AI资源# AI开源项目# 专业生产力工具4个月前01.1K
OpenAI.fm:展示OpenAI语音API的交互式演示工具综合介绍 openai-fm 是一个开源项目,托管在 GitHub 上,专门用于展示 OpenAI 文本转语音(Text-to-Speech, TTS)API 的功能。这个项目通过一个交互式网页应用...最新AI资源# AI开源项目4个月前0877
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具综合介绍 Find My Kids 是一个开源项目,托管在 GitHub 上,由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...最新AI资源# AI开源项目# 视觉目标检测4个月前0815
DocAgent:自动生成Python代码文档的智能工具综合介绍 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析,自动为 Python 代码库生成高质量、上下文感知的文档注释(d...最新AI资源# AI开源项目4个月前0785
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...最新AI资源# AI开源项目4个月前0857
OpenUtau:免费的开源歌声合成编辑工具综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...最新AI资源# AI开源项目# AI音乐4个月前01.3K
MCP Containers:基于 Docker 提供数百种 MCP 容器化部署综合介绍 MCP Containers 是一个开源项目,托管在 GitHub,专注于为 Model Context Protocol(MCP)服务器提供容器化解决方案。它通过 Docker 容器简化了...最新AI资源# AI开源项目# MCP服务4个月前01.2K
NodeRAG:基于异构图的精准信息检索与生成工具综合介绍 NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。Nod...最新AI资源# AI开源项目# 知识检索与RAG框架4个月前01.4K
Open Codex:将自然语言转换为Shell命令的开源AI工具综合介绍 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在...最新AI资源# AI开源项目4个月前0780
SkyReels V2:生成无限长度视频的开源AI工具综合介绍 SkyReels-V2 是一个开源的视频生成模型,由 SkyworkAI 开发。它通过先进的 Diffusion Forcing 技术,支持生成无限长度的视频,适用于文本转视频(T2V)和图...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频4个月前01.2K
Dia:生成超现实多人对话的文本转语音模型综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表...最新AI资源# AI开源项目# AI文本转语音4个月前0837
Sidekick CLI:一个开源的 Claude Code 替代工具综合介绍 Sidekick CLI 是一个开源的命令行工具,旨在通过 AI 辅助简化开发者的项目开发和部署流程。它受到 Claude Code、Copilot 和 Cursor 的启发,提供类似的功能...最新AI资源# AI开源项目# AI编程4个月前01.1K
Kernel Images:轻量级沙盒化浏览器的开源解决方案综合介绍 Kernel Images 是一个开源项目,托管于 GitHub,提供轻量级、沙盒化的 Chrome 浏览器环境。它基于 Docker 和 Unikraft 技术,构建隔离的浏览器实例,支持...最新AI资源# AI开源项目4个月前0698
Plandex:支持超长上下文的开源AI编码助手综合介绍 Plandex 是一个开源的终端 AI 编码助手,专为大型复杂软件项目设计。它能规划和执行多步骤任务,处理高达 200 万 token 的上下文,支持 30 多种编程语言。Plandex 提...最新AI资源# AI开源项目# AI编程4个月前01K
BiliNote:从视频自动生成Markdown笔记的AI工具综合介绍 BiliNote 是一款开源的 AI 视频笔记工具,支持从哔哩哔哩和 YouTube 视频链接中提取内容,自动生成结构清晰的 Markdown 格式笔记。它利用本地音频转写和多种大模型(如 ...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI笔记4个月前0814
OneFileLLM:整合多种数据源为单一文本文件综合介绍 OneFileLLM 是一个开源命令行工具,旨在将多种数据源整合成单一文本文件,方便输入大语言模型(LLM)。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...最新AI资源# AI开源项目# 文档提取与清洗4个月前01.2K
FramePack:6G低显存快速生成长视频的开源项目综合介绍 FramePack 是一个开源的视频生成工具,专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络,将输入帧压缩到固定长度,使生成工作量与视频长度解耦。这意味着即使生成长视频,显存需求...最新AI资源# AI图像转视频# AI开源项目3个月前0944
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手综合介绍 OpenAI Codex CLI 是一个开源的终端编码工具,由 OpenAI 开发,专为习惯终端的开发者设计。它通过自然语言指令生成代码、编辑文件、执行命令,并集成 Git 版本控制。Cod...最新AI资源# AI开源项目# AI编程4个月前01.2K
MiniMind-V:1小时训练26M参数视觉语言模型综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...最新AI资源# AI开源项目# 大模型微调4个月前01K
Open Sora:优化脸部一致性的开源视频生成工具综合介绍 Open-Sora 是一个开源项目,旨在让任何人都能高效生成高质量视频。它由 hpcaitech 团队开发,提供从文本或图像生成视频的工具,支持多种分辨率和时长。项目完全开源,公开模型权重...最新AI资源# AI图像转视频# AI开源项目4个月前0874
基于Cloudflare Worker的AI图片生成脚本综合介绍 CloudFlare-AI-Image 是一个开源项目,托管在 GitHub 上,通过 Cloudflare Workers 平台提供免费的 AI 图像生成服务。它支持文生图和图生图功能,基...最新AI资源# AI开源项目# 免费大模型API4个月前0938
OneLine:生成热点事件时间轴的AI工具综合介绍 OneLine 是一个开源的热点事件时间轴生成工具,托管在 GitHub,由用户 chengtx809 开发。它通过用户输入的关键词,快速生成事件的时间轴,展示事件的时间、标题、描述和相关人...最新AI资源# AI开源项目# AI搜索工具4个月前0985
AiPy:自动化运行Python代码完成数据分析任务综合介绍 AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Pytho...最新AI资源# AI开源项目# 桌面自动化智能体4个月前0878
实时语音转文字的开源工具综合介绍 realtime-transcription-fastrtc 是一个开源项目,专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流,结合本地 Whisper 模型实现高效...最新AI资源# AI开源项目# AI语音转文本4个月前01.2K
Dify 工作流 DSL 文件合集下载综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目,专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台,而这个项目为用户提...最新AI资源# AI开源项目4个月前02.6K
Agnai Chat:与个性化AI角色互动的开源聊天平台综合介绍 Agnai Chat 是一个开源的AI聊天平台,用户可以创建个性化AI角色,进行单人或多人互动。它支持多种AI服务,包括OpenAI、Claude、Kobold等,适合娱乐、角色扮演、教育或...最新AI资源# AI开源项目# AI本地化聊天应用4个月前01.1K
语析(Yuxi-Know):基于知识图谱的智能问答平台综合介绍 Yuxi-Know 是一个开源的智能问答平台,结合知识图谱和 RAG(检索增强生成)技术,帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱,使用 FastAPI 和 VueJS 构...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架4个月前01.2K
Chatlog:提取和查询微信聊天记录的开源工具综合介绍 Chatlog 是一个开源工具,专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本,覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗4个月前01.4K
VOP:提取复杂图表与数学公式的OCR工具综合介绍 Versatile OCR Program 是一个开源的光学字符识别(OCR)工具,专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图,并生...最新AI资源# AI开源项目# OCR# 文档提取与清洗4个月前01.2K
Orpheus-TTS:生成自然中文语音的文本转语音工具综合介绍 Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语...最新AI资源# AI开源项目# AI文本转语音4个月前01.2K
免服务器生成永久微信群二维码综合介绍 serverless-qrcode-hub 是一个开源工具,专为解决微信群聊二维码频繁失效的问题而设计。它基于 Cloudflare Workers 和 D1 数据库,无需传统服务器即可运行...AI实操教程# AI开源项目4个月前01.6K
self.so:一键生成精美的个人简历网页综合介绍 self.so 是一个开源工具,专为快速将简历或 LinkedIn 个人资料转化为个人网站而设计。用户只需上传 PDF 简历或输入 LinkedIn 链接,系统通过 AI 技术(基于 Tog...最新AI资源# AI开源项目# AI生活效率助手4个月前01.2K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目综合介绍 OmniSVG 是一个开源项目,专注于通过多模态模型生成高质量矢量图形(SVG)。它利用预训练的视觉-语言模型,支持从文本描述或图像输入生成 SVG,涵盖简单图标到复杂动漫角色的多种场景。项...最新AI资源# AI图像风格控制# AI开源项目4个月前01.4K
Napkins.dev:基于Llama4上传线框图生成前端代码综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...最新AI资源# AI开源项目# AI页面设计4个月前0980
Agent-Wiz:分析AI智能体工作流程和安全风险综合介绍 Agent-Wiz 是一个开源的Python命令行工具,专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程,生...最新AI资源# AI开源项目# 智能体开发框架4个月前0773
Orion:小米开源的端到端自动驾驶推理与规划框架综合介绍 Orion 是小米实验室开发的开源项目,专注于端到端(E2E)自动驾驶技术。它通过视觉语言模型(VLM)和生成式规划器,解决传统自动驾驶方法在复杂场景中因果推理不足的问题。Orion 整合长...最新AI资源# AI开源项目4个月前0865
ReCamMaster:从单一视频生成多视角视频的渲染工具综合介绍 ReCamMaster 是一个开源视频处理工具,核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹,重新渲染视频,获得不同角度的动态画面。它由浙江大学、快手科技等团队开发,基于文本到...最新AI资源# AI开源项目# AI视频转换风格4个月前01K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目4个月前01.1K
Austen:分析书籍角色关系并生成图表的AI工具综合介绍 Austen 是一个开源的 AI 工具,它使用 Angular 框架和 Analogjs 初始化,结合 Mermaidjs 技术生成图表,帮助用户分析书籍中的角色关系。用户可以输入 Open...最新AI资源# AI开源项目# AI白板与信息图4个月前01.1K
DeepCoder-14B-Preview:擅长代码生成的的开源模型综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...最新AI资源# AI开源项目# 大模型微调4个月前01.2K
Thera:任意尺寸图像放大、去锯齿的开源工具综合介绍 Thera 是一个开源的图像超分辨率工具,由苏黎世联邦理工学院(ETH Zurich)和苏黎世大学的团队开发。它能将低分辨率图像放大到任意尺度,比如 2 倍、3.14 倍甚至非整数倍,并且放...最新AI资源# AI图像放大与修复# AI开源项目4个月前0942
A2A:谷歌发布AI智能间通信的开放协议综合介绍 A2A(Agent2Agent)是谷歌开发的一个开源协议,目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法,让智能体可以发现彼此的能力、分担任务并完成工作...最新AI资源# AI开源项目# 智能体开发框架4个月前01.3K
Tabby:可集成到 VSCode 的本地自托管AI编程助手综合介绍 Tabby 是一个开源的 AI 编程助手,由 TabbyML 团队开发,用户可以自己部署在本地或服务器上。它提供类似 GitHub Copilot 的功能,比如代码自动补全和智能问答,但最大...最新AI资源# AI开源项目# AI编程4个月前01.2K
LM Speed:快速测试大模型API性能综合介绍 LM Speed 是一个专门为AI开发者设计的工具,同时提供在线服务网站 lmspeed.net。它的核心功能是测试和分析语言模型 API 的性能,帮助用户快速发现速度瓶颈并优化调用策略。这...最新AI资源# AI开源项目4个月前01K
DevDocs:快速抓取并整理技术文档的MCP服务综合介绍 DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Ma...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗4个月前01.3K
TestDriver:使用AI自动测试软件的智能工具综合介绍 TestDriver 是一个利用人工智能技术帮助开发者测试软件的网站。它通过模拟人类操作,比如点击鼠标、输入文字,来自动完成软件的测试任务。网站的核心是“计算机使用AI代理”,能像真人一样操...最新AI资源# AI开源项目4个月前0900
SiteMCP:抓取网站内容并转为MCP服务综合介绍 SiteMCP 是一个开源工具,核心功能是抓取整个网站的内容并将其转化为 MCP(Model Context Protocol)服务器,让 AI 助手(如 Claude Desktop)直接...最新AI资源# AI开源项目# MCP服务4个月前01.2K
Deep Chat:快速集成到网站的AI聊天组件综合介绍 Deep Chat 是一个开源的 AI 聊天组件,专为网站开发者设计。它由 Ovidijus Parsiunas 开发,托管在 GitHub 上,目前已有超过 2k 星标。用户可以通过简单配...最新AI资源# AI客服机器人# AI开源项目4个月前01.2K
Arrakis:为AI智能体提供安全沙盒环境的开源工具综合介绍 Arrakis 是一个专为 AI 智能体设计,提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发,托管在 GitHub 上,使用 AGPL v3 许可证。Arrak...最新AI资源# AI开源项目4个月前0804
自动解析PDF内容并提取文字与表格的开源服务综合介绍 它能自动分析PDF文档的布局,识别页面中的文字、标题、图片、表格、公式等元素,并判断它们的正确顺序。工具支持OCR功能,可以把扫描PDF转为可搜索文本。它基于Docker运行,提供两种模型...最新AI资源# AI开源项目# OCR# 文档提取与清洗4个月前0968
Dolphin:面向亚洲语言识别与语音转文本模型综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型,专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言,以及 22 种中国方言...最新AI资源# AI开源项目# AI语音转文本4个月前01K
AstrBot:具有WebUI的AI聊天机器人接入平台综合介绍 AstrBot 是一个开源的聊天机器人开发框架,它支持 QQ、Telegram、微信等多种消息平台,并能轻松接入 OpenAI、DeepSeek、Google Gemini 等大语言模型(L...最新AI资源# AI客服机器人# AI开源项目4个月前01.2K
WeClone:用微信聊天记录和语音训练数字分身综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...最新AI资源# AI开源项目# 大模型微调4个月前01.2K
DiffPortrait360:从单张人像生成360度头部视图综合介绍 DiffPortrait360 是一个开源项目,隶属于 CVPR 2025 论文《DiffPortrait360: Consistent Portrait Diffusion for 360...最新AI资源# AI图像风格控制# AI开源项目4个月前0958
mcp-ui:基于MCP协议的简洁AI聊天界面综合介绍 mcp-ui 是一个开源项目,由开发者 machaojin1917939763 创建,基于 Model Context Protocol(MCP)协议打造,是一款支持 Web 和桌面环境的智...最新AI资源# AI开源项目# AI本地化聊天应用4个月前01.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台综合介绍 Comp AI 是一个开源平台,由 Comp AI, Inc. 开发,总部位于美国旧金山。它帮助企业通过自动化工具快速完成 SOC 2、ISO 27001 和 GDPR 等合规要求,目标是几...最新AI资源# AI开源项目# 专业生产力工具4个月前01.2K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR4个月前01.5K
KrillinAI:一键翻译和配音的视频多语言全球化工具综合介绍 KrillinAI 是一个开源的视频处理工具,专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始,一直到生成适配不同平台的成品,全程只需几次点击。开发者在 GitHub 上提供了...最新AI资源# AI开源项目# AI翻译2个月前01.6K
AiryLark:支持多格式文档智能翻译的开源工具综合介绍 AiryLark 是一个开源的文档处理与翻译工具,托管在 GitHub 上,由开发者 wizd 基于 Next.js 框架打造。它支持多种文件格式(如 PDF、Word、TXT、Markdo...最新AI资源# AI开源项目# AI翻译4个月前01.3K
Zola:支持文档上传与多模型的开源AI聊天Web应用综合介绍 Zola 是一个免费且开源的 AI 聊天应用,由开发者 Julien Thibeaut(GitHub 用户名 ibelick)开发,托管在 GitHub 上。它最大的特点是支持多种 AI 模...最新AI资源# AI开源项目# AI本地化聊天应用# AI集成多模型对话平台4个月前0994
DeepResearcher:基于强化学习驱动AI研究复杂问题综合介绍 DeepResearcher 是由上海交通大学 GAIR-NLP 团队开发的开源项目。它是一个基于大型语言模型(LLM)的智能研究工具,通过强化学习(RL)在真实网络环境中进行端到端训练。项...最新AI资源# AI开源项目# 生成深度研究报告4个月前0850
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令,比如“宗介开紫色车兜风”,生成动漫视频,还能让不同动漫角色互动,比如《魔女宅急便》的琪琪和《天空之城...最新AI资源# AI开源项目# AI视频生成工具# AI视频转换风格4个月前01.2K
Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室(Shanghai AI Laboratory)、香港中文大学(CUHK)等机构联合开发的开源项目,托管于 GitHub,由 Alpha...最新AI资源# AI开源项目4个月前01.3K