Chat2DB:智能生成SQL与数据报表的数据库管理工具综合介绍 Chat2DB 是一款由 CodePhiliaX 团队开发的开源数据库管理和SQL客户端工具,集成了AI功能,支持快速编写SQL查询、管理数据库、生成数据报表以及多数据库交互。它支持超过16...最新AI资源# AI开源项目# AI数据分析10个月前056.8K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...最新AI资源# AI开源项目# 桌面自动化智能体1年前056.8K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI资源# AI开源项目# AI编程# 智能体开发框架10个月前056.8K
AudioX:参考文本、图像、视频生成音频和音乐综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...最新AI资源# AI开源项目# AI音乐9个月前056.7K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型综合介绍 DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型,显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文...最新AI资源# AI开源项目# 多模态实时互动产品11个月前056.7K
ImBD:AI生成内容检测,检测内容是否由人工智能生成综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别A...最新AI资源# AI开源项目# AI教育工具1年前056.5K
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...最新AI资源# AI开源项目# 大模型微调10个月前056.3K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片综合介绍 InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装1年前056.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)综合介绍 AingDesk是一款开源且免费的软件,旨在帮助用户轻松地在本地计算机上部署和运行各种AI模型。无论是 DeepSeek 还是 Llama 模型,AingDesk都能通过简单的操作步骤实现一...最新AI资源# AI开源项目# AI本地化聊天应用11个月前056.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手综合介绍 Continue是一个开源的AI代码助手,旨在提高软件开发者的效率。其主要功能包括代码自动完成、代码优化和智能代码建议,适用于VS Code和JetBrains IDEs。Continue不...最新AI资源# AI开源项目# AI编程11个月前056.2K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量...最新AI资源# AI开源项目# AI文本转语音12个月前056.2K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用综合介绍 Steel Browser是一个开源的浏览器API,专为AI代理和应用程序设计。它提供了一个完整的浏览器实例,允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...最新AI资源# AI开源项目1年前056.1K
Mad Professor:辅助阅读和分析学术论文的AI工具综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...最新AI资源# AI开源项目# AI教育工具8个月前056.1K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用综合介绍 MNN(Mobile Neural Network)是阿里巴巴开发的一个高效、轻量级的深度学习框架,专为移动端设备优化。MNN不仅能够在移动设备上进行快速推理,还支持多模态任务,包括文本生成...最新AI资源# AI开源项目# AI本地化聊天应用12个月前056.1K
A2A:谷歌发布AI智能间通信的开放协议综合介绍 A2A(Agent2Agent)是谷歌开发的一个开源协议,目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法,让智能体可以发现彼此的能力、分担任务并完成工作...最新AI资源# AI开源项目# 智能体开发框架9个月前055.8K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应...最新AI资源# AI开源项目# AI语音克隆1年前055.8K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库,由南洋理工大学 S-Lab 的研究团队开发,并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器(C...最新AI资源# AI副业赚钱项目# AI图像放大与修复# AI开源项目1年前055.8K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程综合介绍 Hugging Face的Open R1项目是一个完全开源的DeepSeek-R1复现项目,旨在构建R1管道的缺失部分,使每个人都能复现并在其基础上进行构建。该项目设计简单,主要包括训练和评...最新AI资源# AI开源项目12个月前055.7K
FreeAI:基于Pollinations封装的的免费AI工具综合介绍 FreeAI 是一个基于 Pollinations.AI API 的开源 AI 应用平台,提供免费且无限制的 AI 聊天助手、图像生成和语音合成服务。这个项目由开发者 Azad-sl 在 G...最新AI资源# AI开源项目# AI集成多模型对话平台9个月前055.7K
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI资源# AI开源项目# OCR9个月前055.5K
TANGO:语音生成协调手势人像视频的工具,全身像数字人综合介绍 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...最新AI资源# AI开源项目# AI数字人1年前055.5K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持综合介绍 知识图谱工作室(Knowledge Graph Studio)是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...最新AI资源# AI开源项目# 知识图谱1年前055.5K
Open Deep Research:LangChain开源的深度研究智能助手综合介绍 Open Deep Research 是一个基于网络的研究助手,能够生成有关任何主题的综合研究报告。该系统采用计划和执行的工作流程,用户可以先对报告结构进行规划并审阅,然后进入耗时的研究阶段...最新AI资源# AI开源项目# 生成深度研究报告10个月前055.5K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架,旨在简化和自动化日常计算机任务,使人工智能更易于使用。它通过模块化设计和预设提示词(Patterns)帮助用户高效...最新AI资源# AI开源项目# PROMPTS辅助工具1年前055.4K
GFPGAN:腾讯开源的人脸修复算法综合介绍 GFPGAN(Generative Facial Prior GAN)是由腾讯ARC(Applied Research Center)开发的一种开源人脸修复算法。该算法利用预训练的面部GAN...最新AI资源# AI图像放大与修复# AI开源项目1年前055.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...最新AI资源# AI开源项目# 文档提取与清洗12个月前055.3K
GraphRAG-Dify:让Dify具备GraphRAG能力综合介绍 GraphRAG-Dify是一个开源项目,旨在结合GraphRAG和Dify技术,快速创建和部署AI Agent。该项目利用FastAPI和Uvicorn进行服务搭建,并支持DSL导入,方便...最新AI资源# AI开源项目# 知识图谱1年前055.3K
Coze on WeChat:将Coze(扣子)机器人接入微信综合介绍 Coze on WeChat 是一个开源项目,旨在帮助用户将 Coze 平台的 AI 机器人无缝接入微信。它基于 chatgpt-on-wechat 和 dify-on-wechat 开发...最新AI资源# AI客服机器人# AI开源项目10个月前055.2K
Unsloth:高效微调和训练大语言模型的开源工具综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...最新AI资源# AI开源项目# 大模型微调11个月前055.1K
MiniMind:2小时从零训练26M参数GPT的开源工具综合介绍 MiniMind 是一个开源项目,由开发者 jingyaogong 创建。它的核心目标是让普通人也能快速训练自己的 AI 模型。MiniMind 主打特点是用 2 小时在单张 NVIDIA ...最新AI资源# AI开源项目10个月前055K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话综合介绍 ChatFree是一个开源项目,旨在让用户的AI应用摆脱浏览器的束缚,实现本地化运行。利用GPT API创建的Copilot,旨在支持多种办公软件如Office、Word、WPS等。该项目由...最新AI资源# AI开源项目# AI本地化聊天应用1年前055K
Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型综合介绍 Qwen2.5-VL 是阿里巴巴云(Alibaba Cloud)Qwen 团队开发的开源多模态大模型。它能同时处理文本、图像、视频和文档,是 Qwen2-VL 的升级版,基于 Qwen2.5...最新AI资源# AI开源项目10个月前054.9K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)综合介绍 Anon-Kode 是一个基于终端操作的开源AI代码助手,由开发者 Daniel Nakov 在 GitHub 上推出。它专为程序员设计,通过集成支持 OpenAI 风格 API 的语言模型...最新AI资源# AI开源项目# AI编程10个月前054.9K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑综合介绍 TRELLIS是一个由Microsoft开发的大型3D资产生成模型。它能够接收文本或图像提示,并生成各种格式的高质量3D资产,如辐射场、3D高斯和网格。TRELLIS的核心是统一的结构化潜在...最新AI资源# AI开源项目# AI文本与图片转3D1年前054.9K
Magic MCP:生成现代化UI组件的MCP服务综合介绍 Magic MCP 是由 21st.dev 团队开发的一款 AI 驱动工具,专为前端开发者设计。它能通过自然语言描述即时生成现代化的 UI 组件,集成在 Cursor、WindSurf 和 ...最新AI资源# AI开源项目# AI页面设计# MCP服务10个月前054.8K
Fish Speech:快速且高精度使用少样本克隆中英文语音综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音(TTS)合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术,能够将文本转换成逼真的语音。Fish S...最新AI资源# AI开源项目# AI语音克隆11个月前054.8K
Cog-ComfyUI:使用API运行ComfyUI工作流综合介绍 Cog-ComfyUI是一个开源项目,旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建,提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI12个月前054.8K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持综合介绍 J.A.R.V.I.S.(Just A Rather Very Intelligent System)是一个智能代码助手,旨在利用多种最先进的语言模型来帮助开发者进行代码生成、修改和技术讨论...最新AI资源# AI开源项目# AI编程1年前054.7K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)综合介绍 AI Auto Free 是一个强大的自动化工具,旨在帮助用户无限制地使用AI驱动的集成开发环境(IDE),如 Cursor 和 Windsurf 。该项目提供跨平台支持,并包含多种语言功能...最新AI资源# AI开源项目12个月前054.7K
PPTX2MD:将PPTX文件转换为Markdown的专用工具综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超...最新AI资源# AI开源项目# 文档提取与清洗11个月前054.7K
IC-Light(V2):图像照明控制神器,控制图像光影和背景综合介绍 IC-Light是一个用于图像照明控制的项目,旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发,提供了两种主要模型:文本条件重光模型和背景条件模型。用户可以通...最新AI资源# AI图像风格控制# AI开源项目1年前054.7K
CrewAI:多角色扮演协作智能框架,简化复杂任务综合介绍 CrewAI 是一个先进的框架,旨在协调角色扮演和自主AI代理的协作。通过促进协作智能,CrewAI 使代理能够无缝协作,解决复杂任务。无论是构建智能助手平台、自动化客户服务团队,还是多代理...最新AI资源# AI开源项目# 智能体开发框架1年前054.6K
Mem0:为AI助手和代理提供智能记忆层的开源项目综合介绍 Mem0(发音为“mem-zero”)是一个为AI助手和代理提供智能记忆层的开源项目。它能够记住用户偏好,适应个体需求,并随着时间的推移不断改进,使其成为客户支持聊天机器人、AI助手和自主系...最新AI资源# AI开源项目1年前054.6K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲综合介绍 DiffRhythm 是由 ASLP-lab(西北工业大学音频、语音与语言处理小组)开发的一个开源项目,专注于通过人工智能技术实现端到端的音乐创作。它基于潜扩散模型(Latent Diffu...最新AI资源# AI开源项目# AI音乐10个月前054.6K
InternVL:开源多模态大模型,支持图像、视频和文本处理综合介绍 InternVL 是由上海人工智能实验室(OpenGVLab)开发的一个开源多模态大模型项目,托管在 GitHub 上。它集成了视觉和语言处理能力,支持图像、视频和文本的综合理解与生成。In...最新AI资源# AI开源项目9个月前054.6K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流综合介绍 腾讯混元3D(Hunyuan3D 2.0)是腾讯推出的先进大规模3D合成系统,旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理...最新AI资源# AI开源项目# AI文本与图片转3D12个月前054.4K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具综合介绍 Cursor Auto Register 是一个开源项目,托管在 GitHub 上。它由开发者 ddCat-main 创建,旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号...最新AI资源# AI开源项目10个月前054.4K
FinRobot:提升金融数据分析效率和投资研究的的智能体综合介绍 FinRobot是由AI4Finance Foundation开发的开源AI智能平台,专为金融分析设计。它不仅涵盖了传统的语言模型,还融入了多种AI技术,旨在为金融行业提供全面的解决方案。F...最新AI资源# AI开源项目# AI金融数据分析11个月前054.4K
BrowserTools MCP:实时监控浏览器活动的MCP服务综合介绍 BrowserTools MCP 是一个开源项目,由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务,让 AI 能实时监控浏览器活动,包括日志、网络请求...最新AI资源# AI开源项目# MCP服务10个月前054.2K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现综合介绍 Agent.exe 是一个开源的 Electron 应用程序,利用 Anthropic 的 Claude 3.5 Sonnet API,让用户可以通过 AI 直接控制本地计算机。该项目由 K...最新AI资源# AI开源项目# 桌面自动化智能体1年前054.2K
Agent S:像人类一样操作电脑的开源智能体框架综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任...最新AI资源# AI开源项目# 桌面自动化智能体9个月前054.1K
Whisper Input:利用Groq免费且高速的语音转录文本服务综合介绍 Whisper Input 是一个开源的语音转译工具,用户可以通过按下 Option 按钮开始录制语音,抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...最新AI资源# AI开源项目# AI语音转文本11个月前054.1K
PDF Craft:PDF扫描文件转Markdown的开源工具综合介绍 PDF Craft 是一个开源工具,专为扫描书籍的PDF设计,能将其转换为Markdown格式。它由 oomol-lab 开发,托管在 GitHub 上,适合喜欢整理电子书的用户。工具通过本...最新AI资源# AI开源项目# OCR# 文档提取与清洗10个月前054.1K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库,旨在通过结构化文本生成来提升大语言模型(LLM)的应用能力。该库支持多种模型集成,包括 OpenAI、transformers...最新AI资源# AI开源项目# 文档提取与清洗11个月前053.9K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能综合介绍 KTransformers:专为突破大模型推理瓶颈而生的高性能 Python 框架。 它不仅仅是一个简单的模型运行工具,更是一套 极致的性能优化引擎 和 灵活的接口赋能平台。 KTransf...最新AI资源# AI开源项目11个月前053.7K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。综合介绍 OpenWebUI-Monitor 是一个用于监控 OpenWebUI 用户活动和管理使用限额的仪表板。它可以高效地设置用户配额,实时查看用户数据和可视化信息,支持一键部署,方便用户管理和监...最新AI资源# AI副业赚钱项目# AI开源项目1年前053.7K
Step1X-Edit:自然语言指令编辑图像的开源工具综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然...最新AI资源# AI图像编辑# AI开源项目8个月前053.6K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能综合介绍 MiniPerplx(更名为Scira)是一个极简主义设计的AI驱动搜索引擎,它整合了多种实用功能,为用户提供全方位的信息检索服务。该项目采用现代化的技术栈,包括Next.js、Tailwi...最新AI资源# AI开源项目# AI搜索工具1年前053.6K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。S...最新AI资源# AI开源项目# AI数字人10个月前053.6K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低...最新AI资源# AI开源项目# AI语音克隆1年前053.6K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具综合介绍 multi-model-bolt.new 是一个基于 Bolt.new 的修改版本,允许使用 TogetherAI 模型,支持部署、移动响应和语音输入等功能。用户可以直接在浏览器中提示、运行...最新AI资源# AI IDE# AI开源项目# AI编程1年前053.5K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)综合介绍 BlinkShot 是一个开源的实时AI图像生成器,利用Together AI和Flux Schnell技术,用户可以在输入提示的同时生成高质量的图像。该平台完全免费,支持用户自定义和二次开...最新AI资源# AI在线生成图像# AI开源项目1年前053.5K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具综合介绍 DeOldify 是一个基于深度学习技术的开源项目,专门用于为黑白照片和视频进行智能上色和修复。该项目采用创新的 NoGAN 训练方法,成功解决了传统 GAN 网络在图像上色过程中常见的瑕疵...最新AI资源# AI图像放大与修复# AI图像风格控制# AI开源项目1年前053.5K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆11个月前053.4K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全综合介绍 NSFW Detector 是一个基于 AI 的不适内容检测工具,主要用于检测图像、视频、PDF 文件等是否包含不适内容。该工具采用了 Falconsai/nsfwimagedetectio...最新AI资源# AI图像生成辅助工具# AI开源项目1年前053.3K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语...最新AI资源# AI开源项目# AI语音克隆# 多模态实时互动产品1年前053.3K
Vercel AI SDK:使用流行前端框架构建AI驱动应用程序综合介绍 Vercel AI SDK 是一款由 Vercel 团队开发的开源工具,旨在帮助开发者使用 React、Svelte、Vue 和 Solid 等框架构建人工智能应用。它支持多种语言模型供应商...最新AI资源# AI开源项目12个月前053.3K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新AI资源# AI开源项目11个月前053.3K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存综合介绍 InstantIR 是由 InstantX 团队开发的一款创新的单图像修复模型,旨在复活您损坏的图像,提供极高质量且逼真的细节,能够对受损图像进行高质量的修复。该工具不仅可以恢复图像的细节...最新AI资源# AI图像放大与修复# AI开源项目1年前053.2K
VLM-R1:通过自然语言定位图像目标的视觉语言模型综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目,托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法,结合 Qwen2.5-VL 模型,通过强化学习...最新AI资源# AI开源项目# 视觉目标检测11个月前053.1K
无服务器快速部署Grok3国内镜像站综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型,而 ...最新AI资源# AI开源项目10个月前053.1K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目,由开发者 ngc660sec(云山/eXM)创建并托管于 GitHub。经过两年迭代,目前版本为 V2.3,功能从最初的简单...最新AI资源# AI客服机器人# AI开源项目10个月前053K
Kotaemon:简单部署的开源多模态文档问答工具综合介绍 Kotaemon 是一个开源的文档问答工具,旨在为终端用户和开发者提供基于检索增强生成(RAG)的问答功能。该项目由 Cinnamon 开发,支持多种 LLM API 提供商(如 OpenA...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前053K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程综合介绍 RD-Agent是由微软推出的一款开源工具,旨在自动化和优化研究与开发(R&D)过程。该工具专注于数据驱动的场景,通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...最新AI资源# AI开源项目# 智能体应用10个月前053K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字...最新AI资源# AI开源项目# AI语音转文本1年前052.9K
WeClone:用微信聊天记录和语音训练数字分身综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...最新AI资源# AI开源项目# 大模型微调9个月前052.9K
优化代码生成和展示的Open WebUI综合介绍 Open WebUI Artifacts Overhaul 是基于 Open WebUI 的一个分支项目,由开发者 Nick Tonjum 开发。它是一个开源工具,专注于提升 AI 生成代码...AI新闻# AI开源项目# AI本地化聊天应用9个月前052.8K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...最新AI资源# AI开源项目# 文档提取与清洗1年前052.7K
Klee:桌面本地运行AI大模型并管理私人知识库综合介绍 Klee 是一个开源桌面应用程序,旨在帮助用户在本地运行开源大语言模型(LLM),并提供安全的私人知识库管理和 Markdown 笔记功能。它基于 Ollama 和 LlamaIndex 技...最新AI资源# AI开源项目# AI本地化聊天应用10个月前052.7K
Chonkie:轻量级RAG文本切块库综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...最新AI资源# AI开源项目# 文档提取与清洗11个月前052.6K
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI资源# AI开源项目# AI抠图改背景7个月前052.6K
Sidekick CLI:一个开源的 Claude Code 替代工具综合介绍 Sidekick CLI 是一个开源的命令行工具,旨在通过 AI 辅助简化开发者的项目开发和部署流程。它受到 Claude Code、Copilot 和 Cursor 的启发,提供类似的功能...最新AI资源# AI开源项目# AI编程9个月前052.6K
Dia:生成超现实多人对话的文本转语音模型综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表...最新AI资源# AI开源项目# AI文本转语音9个月前052.6K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑综合介绍 Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git...最新AI资源# AI开源项目# AI编程9个月前052.6K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川...最新AI资源# AI开源项目# AI语音克隆# 多模态实时互动产品11个月前052.5K
One API:多模型API管理与负载均衡,分发系统综合介绍 One API 是一个开源的接口管理与分发系统,支持多种大模型如 OpenAI ChatGPT、Anthropic Claude、Google PaLM 2 & Gemini 等。该...最新AI资源# AI开源项目1年前052.4K
WeChatAI:Windows版微信群聊智能助手客户端综合介绍 WeChatAI 是一款基于 Python 开发的微信群聊和个人智能助手,支持多种大语言模型(如 DeepSeek、Gemini、通义千问),可以实现智能对话、自动回复等功能。该项目采用现代...最新AI资源# AI客服机器人# AI开源项目11个月前052.4K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具,旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型(LLM),通过命令行或桌面应用接口与用户互动。Goose可以执行从代...最新AI资源# AI开源项目# AI编程# 智能体开发框架12个月前052.4K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图综合介绍 tldraw是一款免费且即时的协作绘图工具,提供一个无限画布,用户可以快速绘制图形、撰写文字并进行即时协作。具备界面直观、性能优秀的特点,适用于团队协作和远程工作。通过开源社区支持,tldr...最新AI资源# AI开源项目# AI白板与信息图1年前052.3K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结综合介绍 AI-reads-books-page-by-page是一个基于Python开发的智能PDF书籍分析工具,它能够自动化地对PDF书籍进行逐页分析,提取关键知识点,并在指定页数间隔后生成阶段性...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前052.3K
Gemini Teacher:英语口语发音纠正助手综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通...最新AI资源# AI开源项目# AI教育工具11个月前052.2K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。综合介绍 AI Chatbot Supabase是一个基于Next.js和Supabase构建的开源AI聊天机器人模板。该项目由Vercel开发,旨在提供一个功能全面、可定制的聊天机器人解决方案。通过...最新AI资源# AI开源项目# 知识检索与RAG框架1年前052.2K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型综合介绍 Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试...最新AI资源# AI开源项目# AI换脸与换装1年前052.2K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架,具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用,如浏览器助手、代码解释器和自定义助手...最新AI资源# AI开源项目# 智能体开发框架1年前052K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人综合介绍 LangBot 是一个基于大模型的即时通信机器人平台,支持多种消息平台和大模型。该平台适配 QQ、微信(企业微信、个人微信)、飞书、Discord、OneBot 等消息平台,并支持 Open...最新AI资源# AI开源项目11个月前052K
Spark-TTS:生成自然语音的文本转语音工具综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆10个月前052K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前051.9K
FlowDown(浮望):iOS/macOS下体验流畅的AI客户端综合介绍 FlowDown-App 是一个轻量、高效的 AI 对话客户端,由开发者团队使用 Swift 和 UIKit 开发,旨在为用户提供快速、顺畅的智能对话体验。该应用分为标准版(FlowDown...最新AI资源# AI开源项目# AI本地化聊天应用10个月前051.9K
CrisperWhisper:精确的逐字语音转录工具综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准...最新AI资源# AI开源项目# AI语音转文本1年前051.9K