AI开源项目

共 1020 篇文章

排序

浏览收藏

Sim Studio：开源的AI代理工作流构建工具

综合介绍 Sim Studio 是一个开源的 AI 代理工作流构建平台，专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型（LLM）工作流。用户无需深入编程即可通过拖拽方式创建复...

11个月前

096.5K

Mad Professor：辅助阅读和分析学术论文的AI工具

综合介绍 Mad Professor（暴躁的教授读论文）是一个开源的 AI 学术工具，专为研究人员和学生设计，旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...

最新AI资源 # AI开源项目 # AI教育工具

11个月前

081.1K

AIstudioProxyAPI：无限使用 Gemini 2.5 Pro 模型 API

综合介绍 AIstudioProxyAPI 是一个开源项目，使用 Node.js 和 Playwright 技术，通过模拟 OpenAI API 的方式，将 Google AI Studio 网页版的...

最新AI资源 # AI开源项目 # 免费大模型API

11个月前

070K

Step1X-Edit：自然语言指令编辑图像的开源工具

综合介绍 Step1X-Edit 是一个开源图像编辑框架，由 Stepfun AI 团队开发，托管于 GitHub。它结合多模态大语言模型（Qwen-VL）和扩散变换器（DiT），让用户通过简单的自然...

最新AI资源 # AI图像编辑 # AI开源项目

11个月前

076.4K

Klavis AI：面向AI应用的模型上下文协议（MCP）集成工具

综合介绍 Klavis AI 是一个开源平台，专注于简化模型上下文协议（MCP）的使用和集成。MCP 是一种开放标准，允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...

最新AI资源 # AI开源项目 # MCP服务

11个月前

061.6K

RealtimeVoiceChat：低延迟与AI进行自然口语对话

综合介绍 RealtimeVoiceChat 是一个开源项目，专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音，系统通过浏览器捕获音频，快速转为文字，由大型语言模型（LLM）生成回...

最新AI资源 # AI开源项目 # 多模态实时互动产品

11个月前

084.5K

MiMo：高效数学推理与代码生成的小型开源模型

综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目，专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型，包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...

最新AI资源 # AI开源项目

11个月前

067.7K

Muyan-TTS：个性化播客语音训练与合成

综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音（TTS）模型。它通过超过10万小时的播客音频数据预训练，支持零样本语音合成，生成高质量的自然语音。模型基于 Llama-3.2-3...

最新AI资源 # AI开源项目 # AI文本转语音

11个月前

071.1K

CAD-MCP：通过自然语言指令控制CAD软件的MCP服务

综合介绍 CAD-MCP 是一个开源项目，允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术，让用户无需手动操作 CAD 界面，只需输入简单的文字命令即...

最新AI资源 # AI开源项目 # MCP服务

11个月前

079.6K

GraphGen：利用知识图谱生成合成数据微调语言模型

综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架，托管于 GitHub，专注于通过知识图谱指导合成数据生成，优化大语言模型（LLM）的监督微调。它从...

最新AI资源 # AI开源项目 # 大模型微调 # 知识图谱

11个月前

061.1K

ACI.DEV：通过MCP服务器为AI智能体集成600+工具

综合介绍 ACI.dev 是一个开源基础设施平台，专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理，确保智能体安全访问工具，如 Google Calendar、S...

最新AI资源 # AI开源项目 # MCP服务

11个月前

052.4K

llm.pdf：在PDF文件中运行大型语言模型的实验项目

综合介绍 llm.pdf 是一个开源项目，允许用户在 PDF 文件中直接运行大型语言模型（LLM）。这个项目由 EvanZhouDev 开发，托管在 GitHub 上，展示了一种创新的方法：通过 Em...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

11个月前

058.8K

Abogen：将多种文本格式转换为有声读物的工具

综合介绍 Abogen 是一个开源工具，专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音，同时支持同步字幕生成，适合制作有声读物...

最新AI资源 # AI开源项目 # AI语音转文本

11个月前

077.2K

Local Deep Research：本地运行的生成深度研究报告工具

综合介绍 Local Deep Research 是一个开源的人工智能研究助手，旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行，使用户可以在不依赖云服务的情况下完成研究任务。工具...

最新AI资源 # AI开源项目 # 生成深度研究报告

11个月前

074.5K

Trackers：用于视频对象跟踪的开源工具库

综合介绍 Trackers 是一个开源的 Python 工具库，专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法，如 SORT 和 DeepSORT，允许用户结合不同的对象检测模型（如 YOLO...

最新AI资源 # AI开源项目 # 视觉目标检测

11个月前

069K

Kimi-Audio：开源音频处理与对话基础模型

综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型，专注于音频理解、生成和对话。它支持多种音频处理任务，例如语音识别、音频问答和语音情感识别。模型经过超过 130...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

11个月前

0122.2K

Describe Anything：为图像和视频区域生成详细描述的开源工具

综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目，核心是 Describe Anything Model（DAM）。这个工具能根据用户在图像或视频中标记的...

最新AI资源 # AI开源项目 # 视觉目标检测

11个月前

059.2K

Cooragent：一句话构建多智能体任务协作工具

综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架，托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理，并支持多个代理协作完成复杂任务。框架提供两...

最新AI资源 # AI开源项目 # 智能体开发框架

11个月前

060.3K

InstantCharacter：从单张图片生成一致性角色的开源工具

综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目，托管在 GitHub 上。它通过一张参考图片和一句文本描述，就能生成外观一致的角色图...

最新AI资源 # AI图像风格控制 # AI开源项目

11个月前

074.5K

Claude生成深度研究报告的MCP服务

综合介绍 MCP Server Deep Research 是一个开源工具，通过人工智能和网页搜索，自动为复杂问题生成结构化的研究报告。用户输入研究问题，工具会分解问题、搜索权威信息、评估来源可信度...

最新AI资源 # AI开源项目 # MCP服务 # 生成深度研究报告

11个月前

056.5K

Deep Recall：为大模型提供企业级记忆框架的开源工具

综合介绍 Deep Recall 是一个开源的企业级记忆框架，专为大型语言模型（LLM）设计。它通过高效的上下文检索和整合，提供超个性化的响应能力。框架采用三层架构，包括记忆服务、推理服务和协调器，支...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

11个月前

064.4K

CleverBee：开源AI研究助手，生成引证研究报告

综合介绍 CleverBee 是一个开源的 AI 研究助手，托管在 GitHub 上，由 SureScaleAI 开发。它通过大语言模型（如 Gemini 和 Claude）结合网页浏览技术，帮助用户...

最新AI资源 # AI开源项目 # 生成深度研究报告

11个月前

051.4K

FantasyTalking：生成真实感说话肖像的开源工具

综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目，专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1，结合音频编码器 Wa...

最新AI资源 # AI开源项目 # AI数字人

11个月前

056.6K

Paper2Code：将机器学习论文自动转化为可运行代码

综合介绍 Paper2Code 是一个开源项目，旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型（LLM）系统 PaperCoder，将科学论文自动转化为可运行的代码仓库。系统采用规划...

最新AI资源 # AI开源项目 # 智能体应用

11个月前

063.9K

DeepWiki-Open：为GitHub、GitLab仓库自动生成AI文档

综合介绍 DeepWiki-Open 是一个开源项目，专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系，快速生...

最新AI资源 # AI开源项目

11个月前

0140K

Audibit：将热门科技文章转为随时收听的音频播客

综合介绍 Audibit 是一个开源项目，核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客，让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使...

最新AI资源 # AI开源项目 # AI文本转语音

11个月前

052.4K

VoltAgent：快速构建AI智能体的TypeScript开源框架

综合介绍 VoltAgent 是一个开源的 TypeScript 框架，专为开发者设计，帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式，简化了与大型语言模型（LLM）交互、状态...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

11个月前

074.7K

Quick Prompt：快速管理和使用提示词的浏览器扩展

综合介绍 Quick Prompt 是一个开源的浏览器扩展，专注于提示词（Prompt）的管理和快速输入。用户可以创建、组织和存储提示词库，并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

11个月前

061.3K

Suna：集成浏览器操作与数据分析的智能代理

综合介绍 Suna 是 Kortix AI 开发的一个开源通用 AI 代理，托管在 GitHub 上，基于 Apache 2.0 许可证，允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成...

最新AI资源 # AI开源项目 # 桌面自动化智能体 # 生成深度研究报告

12个月前

0102.5K

InternVL：开源多模态大模型，支持图像、视频和文本处理

综合介绍 InternVL 是由上海人工智能实验室（OpenGVLab）开发的一个开源多模态大模型项目，托管在 GitHub 上。它集成了视觉和语言处理能力，支持图像、视频和文本的综合理解与生成。In...

最新AI资源 # AI开源项目

12个月前

078.5K

roop-unleashed：基于Roop优化的全能换脸工具

综合介绍 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具，继承自 s0md3v 的 Roop 项目，由开发者 C0untFloyd 继续维护并更名为 Roop-Unle...

最新AI资源 # AI开源项目 # AI换脸与换装 # AI视频换脸

12个月前

0115.5K

Potpie AI：快速创建专属代码库的AI工程助手

综合介绍 Potpie AI 是一个开源平台，专注于为开发者提供定制化的AI工程助手。它通过构建代码库的知识图谱，让AI代理深入理解代码结构与逻辑，自动化完成调试、测试、代码生成等任务。用户可以用简单...

最新AI资源 # AI开源项目 # AI编程

12个月前

052.1K

Vexa：实时会议转录与智能知识提取工具

综合介绍 Vexa 是一个开源的实时会议转录和知识管理平台，旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人，自动加入 Google Meet、Zoom 等平台...

12个月前

0103K

RooFlow：基于 Roo Code 扩展的记忆增强系统

综合介绍 RooFlow 是一个开源的AI辅助编程工具，核心功能是通过项目记录保存开发过程中的代码、决策和任务进展。它基于Roo Code扩展，集成了五种模式：架构、编码、测试、调试和问答。这些模式互...

最新AI资源 # AI开源项目 # AI编程

12个月前

083K

Zev：用自然语言快速查询终端命令的CLI工具

综合介绍 Zev 是一个简单易用的命令行界面（CLI）工具，帮助用户通过自然语言快速查询和生成终端命令。用户无需记住复杂的命令语法，只需用日常语言描述需求，Zev 就能生成对应的终端命令。基于 Ope...

最新AI资源 # AI开源项目

12个月前

053.1K

Together Open Deep Research：生成带索引的深度研究报告

综合介绍 Open Deep Research 是一个由 Together AI 团队开发并开源的深度研究工具，托管在 GitHub 上。它通过多代理人工智能工作流，模拟人类研究过程，生成详细的研究报...

最新AI资源 # AI开源项目 # 生成深度研究报告

12个月前

053.4K

LLManager：智能自动化流程审批与人类审核结合的管理工具

综合介绍 LLManager 是一个开源的智能审批管理工具，基于 LangChain 的 LangGraph 框架开发，专注于自动化处理审批请求，同时结合人类审核优化决策。它通过语义搜索、少样本学习和...

最新AI资源 # AI开源项目 # 专业生产力工具

12个月前

059.5K

OpenAI.fm：展示OpenAI语音API的交互式演示工具

综合介绍 openai-fm 是一个开源项目，托管在 GitHub 上，专门用于展示 OpenAI 文本转语音（Text-to-Speech, TTS）API 的功能。这个项目通过一个交互式网页应用...

最新AI资源 # AI开源项目

12个月前

0116.2K

Find My Kids：通过人脸识别和WhatsApp通知的儿童安全监控工具

综合介绍 Find My Kids 是一个开源项目，托管在 GitHub 上，由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...

最新AI资源 # AI开源项目 # 视觉目标检测

12个月前

052.9K

DocAgent：自动生成Python代码文档的智能工具

综合介绍 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析，自动为 Python 代码库生成高质量、上下文感知的文档注释（d...

最新AI资源 # AI开源项目

12个月前

061.7K

UNO：支持单主体和多主体定制化图像生成工具（适合电商配图）

综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型，专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...

最新AI资源 # AI开源项目

12个月前

059.6K

OpenUtau：免费的开源歌声合成编辑工具

综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台，旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者，解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...

最新AI资源 # AI开源项目 # AI音乐

12个月前

0150.6K

MCP Containers：基于 Docker 提供数百种 MCP 容器化部署

综合介绍 MCP Containers 是一个开源项目，托管在 GitHub，专注于为 Model Context Protocol（MCP）服务器提供容器化解决方案。它通过 Docker 容器简化了...

最新AI资源 # AI开源项目 # MCP服务

12个月前

072.1K

NodeRAG：基于异构图的精准信息检索与生成工具

综合介绍 NodeRAG 是一个开源的检索增强生成（RAG）系统，托管在 GitHub，由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成，显著提升检索精准度和上下文相关性。Nod...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

12个月前

066K

Open Codex：将自然语言转换为Shell命令的开源AI工具

综合介绍 Open Codex 是一个开源的命令行AI工具，专为开发者设计，能将自然语言指令转换为精准的Shell命令。它使用本地语言模型（如 phi-4-mini），无需联网或API密钥，所有操作在...

最新AI资源 # AI开源项目

12个月前

068K

SkyReels V2：生成无限长度视频的开源AI工具

综合介绍 SkyReels-V2 是一个开源的视频生成模型，由 SkyworkAI 开发。它通过先进的 Diffusion Forcing 技术，支持生成无限长度的视频，适用于文本转视频（T2V）和图...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

12个月前

0160.4K

Dia：生成超现实多人对话的文本转语音模型

综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音（TTS）模型，专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话，支持情感和语调控制，甚至能生成非语言表...

最新AI资源 # AI开源项目 # AI文本转语音

12个月前

074.5K

Sidekick CLI：一个开源的 Claude Code 替代工具

综合介绍 Sidekick CLI 是一个开源的命令行工具，旨在通过 AI 辅助简化开发者的项目开发和部署流程。它受到 Claude Code、Copilot 和 Cursor 的启发，提供类似的功能...

最新AI资源 # AI开源项目 # AI编程

12个月前

086.3K

Kernel Images：轻量级沙盒化浏览器的开源解决方案

综合介绍 Kernel Images 是一个开源项目，托管于 GitHub，提供轻量级、沙盒化的 Chrome 浏览器环境。它基于 Docker 和 Unikraft 技术，构建隔离的浏览器实例，支持...

最新AI资源 # AI开源项目

12个月前

048.8K

Plandex：支持超长上下文的开源AI编码助手

综合介绍 Plandex 是一个开源的终端 AI 编码助手，专为大型复杂软件项目设计。它能规划和执行多步骤任务，处理高达 200 万 token 的上下文，支持 30 多种编程语言。Plandex 提...

最新AI资源 # AI开源项目 # AI编程

12个月前

061K

BiliNote：从视频自动生成Markdown笔记的AI工具

综合介绍 BiliNote 是一款开源的 AI 视频笔记工具，支持从哔哩哔哩和 YouTube 视频链接中提取内容，自动生成结构清晰的 Markdown 格式笔记。它利用本地音频转写和多种大模型（如 ...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具 # AI笔记

12个月前

093.8K

OneFileLLM：整合多种数据源为单一文本文件

综合介绍 OneFileLLM 是一个开源命令行工具，旨在将多种数据源整合成单一文本文件，方便输入大语言模型（LLM）。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...

最新AI资源 # AI开源项目 # 文档提取与清洗

12个月前

055.4K

FramePack：6G低显存快速生成长视频的开源项目

综合介绍 FramePack 是一个开源的视频生成工具，专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络，将输入帧压缩到固定长度，使生成工作量与视频长度解耦。这意味着即使生成长视频，显存需求...

最新AI资源 # AI图像转视频 # AI开源项目

11个月前

0106.5K

OpenAI Codex CLI：OpenAI发布的终端命令行AI编码助手

综合介绍 OpenAI Codex CLI 是一个开源的终端编码工具，由 OpenAI 开发，专为习惯终端的开发者设计。它通过自然语言指令生成代码、编辑文件、执行命令，并集成 Git 版本控制。Cod...

最新AI资源 # AI开源项目 # AI编程

12个月前

0104.4K

MiniMind-V：1小时训练26M参数视觉语言模型

综合介绍 MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉...

最新AI资源 # AI开源项目 # 大模型微调

12个月前

062.5K

Open Sora：优化脸部一致性的开源视频生成工具

综合介绍 Open-Sora 是一个开源项目，旨在让任何人都能高效生成高质量视频。它由 hpcaitech 团队开发，提供从文本或图像生成视频的工具，支持多种分辨率和时长。项目完全开源，公开模型权重...

最新AI资源 # AI图像转视频 # AI开源项目

12个月前

0136.9K

基于Cloudflare Worker的AI图片生成脚本

综合介绍 CloudFlare-AI-Image 是一个开源项目，托管在 GitHub 上，通过 Cloudflare Workers 平台提供免费的 AI 图像生成服务。它支持文生图和图生图功能，基...

最新AI资源 # AI开源项目 # 免费大模型API

12个月前

082.7K

OneLine：生成热点事件时间轴的AI工具

综合介绍 OneLine 是一个开源的热点事件时间轴生成工具，托管在 GitHub，由用户 chengtx809 开发。它通过用户输入的关键词，快速生成事件的时间轴，展示事件的时间、标题、描述和相关人...

最新AI资源 # AI开源项目 # AI搜索工具

12个月前

057K

AiPy：自动化运行Python代码完成数据分析任务

综合介绍 AiPy 是一个开源的 Python 命令行工具，由 Knownsec 团队开发。它结合大语言模型（LLM）和 Python 运行环境，让用户通过自然语言描述任务，自动生成并运行 Pytho...

最新AI资源 # AI开源项目 # 桌面自动化智能体

12个月前

067.8K

实时语音转文字的开源工具

综合介绍 realtime-transcription-fastrtc 是一个开源项目，专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流，结合本地 Whisper 模型实现高效...

最新AI资源 # AI开源项目 # AI语音转文本

12个月前

066.5K

Dify 工作流 DSL 文件合集下载

综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目，专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台，而这个项目为用户提...

最新AI资源 # AI开源项目

12个月前

0282.5K

Agnai Chat：与个性化AI角色互动的开源聊天平台

综合介绍 Agnai Chat 是一个开源的AI聊天平台，用户可以创建个性化AI角色，进行单人或多人互动。它支持多种AI服务，包括OpenAI、Claude、Kobold等，适合娱乐、角色扮演、教育或...

最新AI资源 # AI开源项目 # AI本地化聊天应用

12个月前

0121.7K

语析（Yuxi-Know）：基于知识图谱的智能问答平台

综合介绍 Yuxi-Know 是一个开源的智能问答平台，结合知识图谱和 RAG（检索增强生成）技术，帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱，使用 FastAPI 和 VueJS 构...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

12个月前

072.3K

Chatlog：提取和查询微信聊天记录的开源工具

综合介绍 Chatlog 是一个开源工具，专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本，覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

12个月前

0128.9K

VOP：提取复杂图表与数学公式的OCR工具

综合介绍 Versatile OCR Program 是一个开源的光学字符识别（OCR）工具，专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图，并生...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

12个月前

052.6K

Orpheus-TTS：生成自然中文语音的文本转语音工具

综合介绍 Orpheus-TTS 是一个开源的文本转语音（TTS）系统，基于 Llama-3b 架构开发，目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出，支持英语、西班牙语、法语...

最新AI资源 # AI开源项目 # AI文本转语音

12个月前

091.5K

免服务器生成永久微信群二维码

综合介绍 serverless-qrcode-hub 是一个开源工具，专为解决微信群聊二维码频繁失效的问题而设计。它基于 Cloudflare Workers 和 D1 数据库，无需传统服务器即可运行...

AI实操教程 # AI开源项目

1年前

072.5K

self.so：一键生成精美的个人简历网页

综合介绍 self.so 是一个开源工具，专为快速将简历或 LinkedIn 个人资料转化为个人网站而设计。用户只需上传 PDF 简历或输入 LinkedIn 链接，系统通过 AI 技术（基于 Tog...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

055.8K

OmniSVG：从文本和图像生成SVG矢量图形的开源项目

综合介绍 OmniSVG 是一个开源项目，专注于通过多模态模型生成高质量矢量图形（SVG）。它利用预训练的视觉-语言模型，支持从文本描述或图像输入生成 SVG，涵盖简单图标到复杂动漫角色的多种场景。项...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

090.5K

Napkins.dev：基于Llama4上传线框图生成前端代码

综合介绍 Napkins.dev 是一个免费的开源项目，核心功能是让用户上传界面截图或线框图，自动生成可运行的前端代码。用户只需提供一张设计图，工具会通过 Llama 4 模型（由 Together ...

最新AI资源 # AI开源项目 # AI页面设计

1年前

060.6K

Agent-Wiz：分析AI智能体工作流程和安全风险

综合介绍 Agent-Wiz 是一个开源的Python命令行工具，专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程，生...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

056.2K

Orion：小米开源的端到端自动驾驶推理与规划框架

综合介绍 Orion 是小米实验室开发的开源项目，专注于端到端（E2E）自动驾驶技术。它通过视觉语言模型（VLM）和生成式规划器，解决传统自动驾驶方法在复杂场景中因果推理不足的问题。Orion 整合长...

最新AI资源 # AI开源项目

1年前

097K

ReCamMaster：从单一视频生成多视角视频的渲染工具

综合介绍 ReCamMaster 是一个开源视频处理工具，核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹，重新渲染视频，获得不同角度的动态画面。它由浙江大学、快手科技等团队开发，基于文本到...

最新AI资源 # AI开源项目 # AI视频转换风格

1年前

061.2K

Tarsier：生成高质量视频描述的开源视频理解模型

综合介绍 Tarsier 是字节跳动（ByteDance）开发的一个开源视频-语言模型家族，主要用于生成高质量的视频描述。它由简单的结构组成：CLIP-ViT 处理视频帧，结合大语言模型（LLM）分析...

最新AI资源 # AI开源项目

1年前

066.2K

Austen：分析书籍角色关系并生成图表的AI工具

综合介绍 Austen 是一个开源的 AI 工具，它使用 Angular 框架和 Analogjs 初始化，结合 Mermaidjs 技术生成图表，帮助用户分析书籍中的角色关系。用户可以输入 Open...

最新AI资源 # AI开源项目 # AI白板与信息图

1年前

067.2K

DeepCoder-14B-Preview：擅长代码生成的的开源模型

综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...

最新AI资源 # AI开源项目 # 大模型微调

1年前

055.5K

Thera：任意尺寸图像放大、去锯齿的开源工具

综合介绍 Thera 是一个开源的图像超分辨率工具，由苏黎世联邦理工学院（ETH Zurich）和苏黎世大学的团队开发。它能将低分辨率图像放大到任意尺度，比如 2 倍、3.14 倍甚至非整数倍，并且放...

最新AI资源 # AI图像放大与修复 # AI开源项目

1年前

060.8K

A2A：谷歌发布AI智能间通信的开放协议

综合介绍 A2A（Agent2Agent）是谷歌开发的一个开源协议，目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法，让智能体可以发现彼此的能力、分担任务并完成工作...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

074.2K

Tabby：可集成到 VSCode 的本地自托管AI编程助手

综合介绍 Tabby 是一个开源的 AI 编程助手，由 TabbyML 团队开发，用户可以自己部署在本地或服务器上。它提供类似 GitHub Copilot 的功能，比如代码自动补全和智能问答，但最大...

最新AI资源 # AI开源项目 # AI编程

1年前

090.1K

LM Speed：快速测试大模型API性能

综合介绍 LM Speed 是一个专门为AI开发者设计的工具，同时提供在线服务网站 lmspeed.net。它的核心功能是测试和分析语言模型 API 的性能，帮助用户快速发现速度瓶颈并优化调用策略。这...

最新AI资源 # AI开源项目

1年前

059.8K

DevDocs：快速抓取并整理技术文档的MCP服务

综合介绍 DevDocs 是一个完全免费的开源工具，由 CyberAGI 团队开发，托管在 GitHub 上。它专为程序员和软件开发者设计，能从技术文档的网址开始，自动爬取相关页面并整理成简洁的 Ma...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

1年前

058.2K

TestDriver：使用AI自动测试软件的智能工具

综合介绍 TestDriver 是一个利用人工智能技术帮助开发者测试软件的网站。它通过模拟人类操作，比如点击鼠标、输入文字，来自动完成软件的测试任务。网站的核心是“计算机使用AI代理”，能像真人一样操...

最新AI资源 # AI开源项目

1年前

053.5K

SiteMCP：抓取网站内容并转为MCP服务

综合介绍 SiteMCP 是一个开源工具，核心功能是抓取整个网站的内容并将其转化为 MCP（Model Context Protocol）服务器，让 AI 助手（如 Claude Desktop）直接...

最新AI资源 # AI开源项目 # MCP服务

1年前

060.6K

Deep Chat：快速集成到网站的AI聊天组件

综合介绍 Deep Chat 是一个开源的 AI 聊天组件，专为网站开发者设计。它由 Ovidijus Parsiunas 开发，托管在 GitHub 上，目前已有超过 2k 星标。用户可以通过简单配...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

085.5K

Arrakis：为AI智能体提供安全沙盒环境的开源工具

综合介绍 Arrakis 是一个专为 AI 智能体设计，提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发，托管在 GitHub 上，使用 AGPL v3 许可证。Arrak...

最新AI资源 # AI开源项目

1年前

060.6K

自动解析PDF内容并提取文字与表格的开源服务

综合介绍它能自动分析PDF文档的布局，识别页面中的文字、标题、图片、表格、公式等元素，并判断它们的正确顺序。工具支持OCR功能，可以把扫描PDF转为可搜索文本。它基于Docker运行，提供两种模型...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

1年前

059.3K

Dolphin：面向亚洲语言识别与语音转文本模型

综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型，专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言，以及 22 种中国方言...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

061.6K

AstrBot：具有WebUI的AI聊天机器人接入平台

综合介绍 AstrBot 是一个开源的聊天机器人开发框架，它支持 QQ、Telegram、微信等多种消息平台，并能轻松接入 OpenAI、DeepSeek、Google Gemini 等大语言模型（L...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

0112.6K

WeClone：用微信聊天记录和语音训练数字分身

综合介绍 WeClone 是一个开源项目，它通过微信聊天记录和语音消息，结合大语言模型和语音合成技术，让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型，还可以用少量语音样本生成逼真的声音...

最新AI资源 # AI开源项目 # 大模型微调

1年前

072.6K

DiffPortrait360：从单张人像生成360度头部视图

综合介绍 DiffPortrait360 是一个开源项目，隶属于 CVPR 2025 论文《DiffPortrait360: Consistent Portrait Diffusion for 360...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

056.9K

mcp-ui：基于MCP协议的简洁AI聊天界面

综合介绍 mcp-ui 是一个开源项目，由开发者 machaojin1917939763 创建，基于 Model Context Protocol（MCP）协议打造，是一款支持 Web 和桌面环境的智...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

064.4K

Comp AI：自动化SOC 2、ISO 27001和GDPR合规的开源平台

综合介绍 Comp AI 是一个开源平台，由 Comp AI, Inc. 开发，总部位于美国旧金山。它帮助企业通过自动化工具快速完成 SOC 2、ISO 27001 和 GDPR 等合规要求，目标是几...

最新AI资源 # AI开源项目 # 专业生产力工具

1年前

074.8K

RolmOCR：识别手写和倾斜字符的文档OCR模型

综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别（OCR）工具，基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字，速度比同类工具...

最新AI资源 # AI开源项目 # OCR

1年前

064.5K

KrillinAI：一键翻译和配音的视频多语言全球化工具

综合介绍 KrillinAI 是一个开源的视频处理工具，专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始，一直到生成适配不同平台的成品，全程只需几次点击。开发者在 GitHub 上提供了...

最新AI资源 # AI开源项目 # AI翻译

10个月前

090.5K

AiryLark：支持多格式文档智能翻译的开源工具

综合介绍 AiryLark 是一个开源的文档处理与翻译工具，托管在 GitHub 上，由开发者 wizd 基于 Next.js 框架打造。它支持多种文件格式（如 PDF、Word、TXT、Markdo...

最新AI资源 # AI开源项目 # AI翻译

1年前

051K

Zola：支持文档上传与多模型的开源AI聊天Web应用

综合介绍 Zola 是一个免费且开源的 AI 聊天应用，由开发者 Julien Thibeaut（GitHub 用户名 ibelick）开发，托管在 GitHub 上。它最大的特点是支持多种 AI 模...

1年前

071.4K

DeepResearcher：基于强化学习驱动AI研究复杂问题

综合介绍 DeepResearcher 是由上海交通大学 GAIR-NLP 团队开发的开源项目。它是一个基于大型语言模型（LLM）的智能研究工具，通过强化学习（RL）在真实网络环境中进行端到端训练。项...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

056.1K

AnimeGamer：用语言指令生成动漫视频和角色互动的开源工具

综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令，比如“宗介开紫色车兜风”，生成动漫视频，还能让不同动漫角色互动，比如《魔女宅急便》的琪琪和《天空之城...

最新AI资源 # AI开源项目 # AI视频生成工具 # AI视频转换风格

1年前

064.2K

Lumina-mGPT-2.0：处理多种图像生成任务的自回归图像生成模型

综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室（Shanghai AI Laboratory）、香港中文大学（CUHK）等机构联合开发的开源项目，托管于 GitHub，由 Alpha...

最新AI资源 # AI开源项目

1年前

055.5K

加载更多