AI开源项目

共 1020 篇文章

排序

浏览收藏

RuoYi AI：基于SpringBoot实现AI聊天和绘画的后端框架

综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目，专注于集成 AI 聊天和绘画功能。它完全开源免费，采用 Java17 和 SpringBoot 3.X 技术栈，后台管...

最新AI资源 # AI副业赚钱项目 # AI开源项目

1年前

0111.7K

MiniMind：2小时从零训练26M参数GPT的开源工具

综合介绍 MiniMind 是一个开源项目，由开发者 jingyaogong 创建。它的核心目标是让普通人也能快速训练自己的 AI 模型。MiniMind 主打特点是用 2 小时在单张 NVIDIA ...

最新AI资源 # AI开源项目

1年前

0111.5K

PPTAgent：自动生成和评估PPT演示文稿，文档转PPT

综合介绍 PPTAgent是一个创新的系统，旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法，采用两步流程确保内容质量和视觉效果。此外，PPTAgent还引入了PPTEval，一个全面...

最新AI资源 # AI开源项目 # AI生成演示文稿/PPT

2年前

0111.4K

ImBD：AI生成内容检测，检测内容是否由人工智能生成

综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目，该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用，识别A...

最新AI资源 # AI开源项目 # AI教育工具

2年前

0111.4K

Fish Speech：快速且高精度使用少样本克隆中英文语音

综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音（TTS）合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术，能够将文本转换成逼真的语音。Fish S...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0111.3K

Browser Use Web UI：运行AI智能体浏览网页，让AI能够自动操作网页的开源框架

综合介绍 Browser Use Web UI是一个创新的开源项目，专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上，通过Gradio构建了一个用...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

0111.3K

PaddleOCR：基于飞桨的多语言OCR工具库，支持80多种语言识别

综合介绍 PaddleOCR 是一个基于 PaddlePaddle 的多语言 OCR 工具包，旨在提供实用且超轻量级的 OCR 系统。它支持超过 80 种语言的识别，并提供数据标注和合成工具，支持在服...

最新AI资源 # AI开源项目 # OCR

2年前

0111.2K

Kokoro WebGPU：浏览器中离线运行的文本转语音服务

综合介绍 Kokoro WebGPU是Kokoro文本转语音（TTS）模型的WebGPU版本，由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术，使用户能...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0111.1K

ComfyUI disty Flow：为 ComfyUI 提供友好的用户界面，简化工作流程

综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行，而不是替代工作流程的创建。ComfyUI-dis...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

2年前

0111.1K

FlowiseAI：构建自定义LLM应用的节点拖放界面

综合介绍 FlowiseAI 是一个开源的低代码工具，旨在帮助开发者构建自定义的LLM（大语言模型）应用和AI代理。通过简单的拖放界面，用户可以快速创建和迭代LLM应用，从测试到生产的过程变得更加高效...

最新AI资源 # AI开源项目 # 低代码工作流

2年前

0111.1K

Open Codex：将自然语言转换为Shell命令的开源AI工具

综合介绍 Open Codex 是一个开源的命令行AI工具，专为开发者设计，能将自然语言指令转换为精准的Shell命令。它使用本地语言模型（如 phi-4-mini），无需联网或API密钥，所有操作在...

最新AI资源 # AI开源项目

1年前

0111K

Aider：开源编程助手工具，使用AI助手进行代码编写和文件编辑

综合介绍 Aider是一款强大的开源AI编程助手工具，它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具，Aider支持多种主流编程语言，可以无缝集成到Git...

最新AI资源 # AI开源项目 # AI编程

1年前

0110.5K

阿布量化交易系统：基于Python的开源量化交易平台

综合介绍阿布量化交易系统是一个基于Python开发的开源平台。它由用户“bbfamily”创建，旨在帮助投资者通过代码实现量化交易策略。系统支持股票、期权、期货和比特币等多种金融产品的回测与交易。它...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

0110.4K

Page Assist：本地AI模型对话与检索文档的网页助手插件

综合介绍 Page Assist 是一个开源的浏览器扩展，旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展，用户可以在任何网页上打开一个侧边栏，与本地运行的AI模型进行互动。Page Assi...

最新AI资源 # AI开源项目 # AI本地化聊天应用 # 浏览器AI助手

1年前

0110.3K

One API：多模型API管理与负载均衡,分发系统

综合介绍 One API 是一个开源的接口管理与分发系统，支持多种大模型如 OpenAI ChatGPT、Anthropic Claude、Google PaLM 2 & Gemini 等。该...

最新AI资源 # AI开源项目

2年前

0110.3K

AgenticSeek：完全本地运行的任务自动化AI助手

综合介绍 AgenticSeek 是一个完全本地运行的开源AI助手，基于 Deepseek R1 模型开发。它不需要云端API，也不产生每月数百美元的费用。它的目标是成为类似电影中“贾维斯”的智能助手...

最新AI资源 # AI开源项目 # 智能体应用

1年前

0110.1K

VoltAgent：快速构建AI智能体的TypeScript开源框架

综合介绍 VoltAgent 是一个开源的 TypeScript 框架，专为开发者设计，帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式，简化了与大型语言模型（LLM）交互、状态...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

1年前

0110K

ChatGPT-on-WeChat：基于大模型构建的智能对话机器人，支持微信等多对话平台接入

综合介绍 ChatGPT-on-WeChat项目是一个基于大模型的智能对话机器人，支持个人微信、微信公众号、企业微信应用、飞书、钉钉等多平台接入。用户可以选择GPT3.5、GPT-4、Claude、文...

最新AI资源 # AI开源项目

2年前

0109.9K

tldraw：开源无限画布白板SDK，AI生成简约线框图和UML图

综合介绍 tldraw是一款免费且即时的协作绘图工具，提供一个无限画布，用户可以快速绘制图形、撰写文字并进行即时协作。具备界面直观、性能优秀的特点，适用于团队协作和远程工作。通过开源社区支持，tldr...

最新AI资源 # AI开源项目 # AI白板与信息图

2年前

0109.9K

IC-Light（V2）：图像照明控制神器，控制图像光影和背景

综合介绍 IC-Light是一个用于图像照明控制的项目，旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发，提供了两种主要模型：文本条件重光模型和背景条件模型。用户可以通...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

0109.6K

InstantCharacter：从单张图片生成一致性角色的开源工具

综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目，托管在 GitHub 上。它通过一张参考图片和一句文本描述，就能生成外观一致的角色图...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

0109.6K

DDG-Chat：一键部署Chat2API后端，DuckDuckGo转API

综合介绍 DDG-Chat 是一个开源项目，旨在提供一个可以一键部署到多种平台的 ChatGPT API 后端。该项目支持多种模型，包括 GPT-4o mini、Claude 3 Haiku、Llam...

最新AI资源 # AI开源项目 # 免费大模型API

2年前

0109.4K

OpenPilot：开源自动驾驶系统，为爱车DIY一套自己的智能驾驶系统

综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统，旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来，OpenPilot 已支持超过 2...

最新AI资源 # AI开源项目

1年前

0109.3K

Deep Chat：快速集成到网站的AI聊天组件

综合介绍 Deep Chat 是一个开源的 AI 聊天组件，专为网站开发者设计。它由 Ovidijus Parsiunas 开发，托管在 GitHub 上，目前已有超过 2k 星标。用户可以通过简单配...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

0109.2K

GraphRAG-Dify：让Dify具备GraphRAG能力

综合介绍 GraphRAG-Dify是一个开源项目，旨在结合GraphRAG和Dify技术，快速创建和部署AI Agent。该项目利用FastAPI和Uvicorn进行服务搭建，并支持DSL导入，方便...

最新AI资源 # AI开源项目 # 知识图谱

2年前

0109.1K

Gemini Balance：Gemini模型API兼容OpenAI格式，解锁区域限制并支持多API Key轮询

综合介绍 Gemini Balance是一个基于FastAPI框架开发的OpenAI API代理服务，旨在提供高效的多API Key管理和优化功能。该项目支持Gemini模型调用，主要功能包括多API...

最新AI资源 # AI开源项目

1年前

0109.1K

BEN2：从图像、视频中快速移除背景的深度学习模型

综合介绍 BEN2（Background Erase Network 2）是由Prama LLC开发的一款深度学习模型，专门用于自动从图像中移除背景，并生成前景图像。该模型采用了创新的Confiden...

最新AI资源 # AI开源项目 # AI抠图改背景

1年前

0108.8K

GitIngest：快速将Github代码仓库转为适合LLM理解的文本

综合介绍 GitIngest 是一个开源工具，旨在将 GitHub 代码库转化为适合大语言模型（LLM）提示的文本。通过简单的操作，用户可以将任何 GitHub 仓库的内容提取并格式化为适合 LLM ...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

0108.8K

TANGO：语音生成协调手势人像视频的工具，全身像数字人

综合介绍 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...

最新AI资源 # AI开源项目 # AI数字人

2年前

0108.7K

NGCBot：新闻推送、AI对话与群聊管理的微信机器人

综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目，由开发者 ngc660sec（云山/eXM）创建并托管于 GitHub。经过两年迭代，目前版本为 V2.3，功能从最初的简单...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

0108.6K

BetterWhisperX：自动语音识别与说话人分离，提供高精度单词级时间戳

综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本，专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支，该项目由 Federico ...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

0108.6K

文多多 AiPPT：AI生成PPT,演讲稿生成

综合介绍 AiPPT 是一个基于人工智能技术的PPT生成工具，旨在帮助用户快速创建专业演示文稿。它通过输入主题、上传文件或提供网址等方式，自动生成内容丰富、设计精美的幻灯片，支持原生图表、动画和3D特...

最新AI资源 # AI开源项目 # AI生成演示文稿/PPT

1年前

0108.5K

GPT SoVITS：革命性的语音生成与语音克隆工具

综合介绍 GPT-SoVITS是一款开源的语音转换与合成工具，结合了GPT模型和SoVITS变声器技术。该工具支持零样本与少量样本的即时文本转语音，仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

0108.5K

Magic MCP：生成现代化UI组件的MCP服务

综合介绍 Magic MCP 是由 21st.dev 团队开发的一款 AI 驱动工具，专为前端开发者设计。它能通过自然语言描述即时生成现代化的 UI 组件，集成在 Cursor、WindSurf 和 ...

最新AI资源 # AI开源项目 # AI页面设计 # MCP服务

1年前

0108.2K

Qwen2.5-VL：支持图像视频文档解析的开源多模态大模型

综合介绍 Qwen2.5-VL 是阿里巴巴云（Alibaba Cloud）Qwen 团队开发的开源多模态大模型。它能同时处理文本、图像、视频和文档，是 Qwen2-VL 的升级版，基于 Qwen2.5...

最新AI资源 # AI开源项目

1年前

0108.1K

MCP Playwright：提供浏览器自动化操作的MCP服务

综合介绍 MCP-Playwright 是一个由 ExecuteAutomation 开发并托管在 GitHub 上的开源工具。它基于 Playwright 和 Model Context Proto...

最新AI资源 # AI开源项目 # MCP服务

1年前

0108.1K

Outlines：通过正则表达式、JSON或Pydantic模型生成结构化文本输出

综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库，旨在通过结构化文本生成来提升大语言模型（LLM）的应用能力。该库支持多种模型集成，包括 OpenAI、transformers...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

0108.1K

GFPGAN：腾讯开源的人脸修复算法

综合介绍 GFPGAN（Generative Facial Prior GAN）是由腾讯ARC（Applied Research Center）开发的一种开源人脸修复算法。该算法利用预训练的面部GAN...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

0108K

cognee：基于知识图谱构建的RAG开源框架，核心prompts学习

综合介绍 Cognee是一个专为AI应用和AI代理设计的可靠数据层解决方案。旨在加载和构建LLM(大型语言模型)上下文，通过知识图谱和向量存储创建准确和可解释的AI解决方案。该框架有利于成本节约、可解...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

0107.5K

Abogen：将多种文本格式转换为有声读物的工具

综合介绍 Abogen 是一个开源工具，专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音，同时支持同步字幕生成，适合制作有声读物...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

0107.4K

AutoGen Studio：多代理系统AutoGen的简易用户界面版

综合介绍 AutoGen Studio 2.0 是一个由 AutoGen 提供支持的用户界面，旨在简化创建和管理多代理解决方案的过程。该平台通过直观的界面，使用户能够声明性地定义和修改代理及其工作流程...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

0107.3K

A2A：谷歌发布AI智能间通信的开放协议

综合介绍 A2A（Agent2Agent）是谷歌开发的一个开源协议，目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法，让智能体可以发现彼此的能力、分担任务并完成工作...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

0107.1K

ElizaOS：构建自主执行的多智能体，功能完备的开源AI智能体开发框架

综合介绍 Eliza是一个先进的多智能体(Multi-Agent)开发框架,致力于简化自主智能体(Autonomous Agent)的构建和部署过程。它支持部署多个具有不同角色设定的智能体,可实现智能...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

0107.1K

MetaGPT：多智能体协作框架，构建 AI 软件开发团队实现自然语言编程

综合介绍 MetaGPT 是一个创新的多智能体框架，旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan（Alexander Wu）创建，目标是将不同角色的GPT模型组合成一个协作实体...

最新AI资源 # AI开源项目 # AI编程 # 智能体开发框架

1年前

0107K

Steel Browser：自动化网页浏览器API，构建控制浏览器操作的智能体与应用

综合介绍 Steel Browser是一个开源的浏览器API，专为AI代理和应用程序设计。它提供了一个完整的浏览器实例，允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...

最新AI资源 # AI开源项目

2年前

0107K

TubeTube：自部署YouTube视频下载工具

综合介绍 TubeTube是一个开源的YouTube视频下载工具，由MattBlackOnly开发。该工具使用yt-dlp作为核心下载引擎，支持多线程下载，能够快速同时下载多个视频。用户可以通过YAM...

最新AI资源 # AI开源项目

1年前

0107K

FinGPT：开源金融大语言模型平台，助力金融分析与预测

综合介绍 FinGPT 是由 AI4Finance 基金会开发的开源金融大语言模型平台，专为金融领域设计，旨在解决复杂的金融任务，并推动金融科技的创新发展。FinGPT 利用轻量化适配技术和强化学习方...

最新AI资源 # AI开源项目 # AI金融数据分析

2年前

0106.9K

PPTX2MD：将PPTX文件转换为Markdown的专用工具

综合介绍 PPTX2MD是一个开源工具，旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发，支持保留标题、列表、文本格式（如粗体、斜体、颜色和超...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

0106.8K

Klee：桌面本地运行AI大模型并管理私人知识库

综合介绍 Klee 是一个开源桌面应用程序，旨在帮助用户在本地运行开源大语言模型（LLM），并提供安全的私人知识库管理和 Markdown 笔记功能。它基于 Ollama 和 LlamaIndex 技...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0106.8K

MNN-LLM-Android：MNN 多模态语言模型的安卓应用

综合介绍 MNN（Mobile Neural Network）是阿里巴巴开发的一个高效、轻量级的深度学习框架，专为移动端设备优化。MNN不仅能够在移动设备上进行快速推理，还支持多模态任务，包括文本生成...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

0106.8K

Stagehand：自然语言实现浏览器自动化操作框架

综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright，提供了三个简单的AI API（act、extract和observe），这些API构建在基础...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0106.6K

InstantID：上传一张图片，迁移人像特征来生成不同风格图片

综合介绍 InstantID是一项先进的技术，专注于利用单张参考身份证图片，在几秒钟内生成具有个性化风格或姿态的图像，同时确保高度保真。该技术采用了基于扩散模型的解决方案，通过集成面部图片、地标图...

最新AI资源 # AI图像风格控制 # AI开源项目 # AI换脸与换装

2年前

0106.5K

Cursor Auto Register：自动创建并管理Cursor账号的开源工具

综合介绍 Cursor Auto Register 是一个开源项目，托管在 GitHub 上。它由开发者 ddCat-main 创建，旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号...

最新AI资源 # AI开源项目

1年前

0106.4K

Mad Professor：辅助阅读和分析学术论文的AI工具

综合介绍 Mad Professor（暴躁的教授读论文）是一个开源的 AI 学术工具，专为研究人员和学生设计，旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...

最新AI资源 # AI开源项目 # AI教育工具

1年前

0106.4K

Step1X-Edit：自然语言指令编辑图像的开源工具

综合介绍 Step1X-Edit 是一个开源图像编辑框架，由 Stepfun AI 团队开发，托管于 GitHub。它结合多模态大语言模型（Qwen-VL）和扩散变换器（DiT），让用户通过简单的自然...

最新AI资源 # AI图像编辑 # AI开源项目

1年前

0106.2K

Orama：高性能全文本和向量搜索引擎

综合介绍 Orama 是一个开源的高性能搜索引擎，完全用 TypeScript 编写，支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作，提供快速、可靠...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

0106.2K

CrewAI：多角色扮演协作智能框架，简化复杂任务

综合介绍 CrewAI 是一个先进的框架，旨在协调角色扮演和自主AI代理的协作。通过促进协作智能，CrewAI 使代理能够无缝协作，解决复杂任务。无论是构建智能助手平台、自动化客户服务团队，还是多代理...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

0105.8K

FreeAI：基于Pollinations封装的的免费AI工具

综合介绍 FreeAI 是一个基于 Pollinations.AI API 的开源 AI 应用平台，提供免费且无限制的 AI 聊天助手、图像生成和语音合成服务。这个项目由开发者 Azad-sl 在 G...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

0105.6K

Anon-Kode：命令行AI代码助手（Claude Code代码反编译）

综合介绍 Anon-Kode 是一个基于终端操作的开源AI代码助手，由开发者 Daniel Nakov 在 GitHub 上推出。它专为程序员设计，通过集成支持 OpenAI 风格 API 的语言模型...

最新AI资源 # AI开源项目 # AI编程

1年前

0105.6K

MoneyPrinterTurbo：输入视频主题一键生成视频文案和高清短视频

综合介绍 MoneyPrinterTurbo 是一个开源项目，利用先进的AI大模型技术，实现了一键生成高清短视频的功能。用户只需提供一个视频主题或关键词，系统便会自动生成视频文案、视频素材、视频字幕和...

最新AI资源 # AI开源项目 # AI视频生成工具

1年前

0105.6K

Search-R1：强化学习训练大模型搜索与推理的工具

综合介绍 Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会...

最新AI资源 # AI开源项目 # 大模型微调

1年前

0105.4K

Moffee：将Markdown转为PPT幻灯片

综合介绍 Moffee 是一个开源工具，它能把 Markdown 文件快速变成专业的幻灯片，简单又高效。用户只需写好 Markdown 内容，Moffee 就能自动处理布局、分页和样式，省去手动排版的...

最新AI资源 # AI开源项目 # AI生成演示文稿/PPT

1年前

0105.2K

DeepSeek-VL2：高级多模态理解的专家级视觉语言模型

综合介绍 DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型，显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

0105.2K

Refly：基于自由画布上流程编排的AI写作平台，自动化生成文章

综合介绍 Refly 是一个基于自由画布的 AI 原生创作引擎，旨在通过多线程对话、知识库集成、上下文记忆和智能搜索技术，帮助用户将创意转化为高质量内容。该平台覆盖了超过 20 种专业场景模板，包括学...

最新AI资源 # AI写作 # AI开源项目

1年前

0104.9K

Gemini-OpenAI：反代Gemini地址绕过区域限制并转换为OpenAI兼容API

综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台，适用于个人使用。该项目...

最新AI资源 # AI开源项目

2年前

0104.7K

TreeGPT：可视化树状对话的AI聊天界面

综合介绍 TreeGPT 是一个基于 Next.js 开发的开源聊天应用，专注于通过树状图结构（有向无环图，DAG）可视化与大型语言模型（LLM，如 GPT）的对话，取代传统的线性聊天方式，提升速度和...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0104.6K

Unstructured：开源预处理非结构化文档，无结构数据处理的利器

综合介绍 Unstructured-IO 提供了一系列开源组件，用于处理和预处理图像和文本文档，如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程，特别是为大语言模型（LL...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

0104.6K

无服务器快速部署Grok3国内镜像站

综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型，而 ...

最新AI资源 # AI开源项目

1年前

0104.5K

MobileAgent：多代理协作的移动设备操作助手

综合介绍 MobileAgent 是一个强大的移动设备操作助手，旨在通过多代理协作和增强的视觉感知模块，提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发，支持 Android 和 ...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0104.4K

Kokoro：高效语音合成模型，生成自然流畅的语音

综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型，旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数，使用 Apache 2.0 许可证发...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

0104K

Firecrawl MCP Server：基于 Firecrawl 的网页爬虫 MCP 服务

综合介绍 Firecrawl MCP Server 是由 MendableAI 开发的一款开源工具，基于 Model Context Protocol (MCP) 协议实现，与 Firecrawl A...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

1年前

0103.7K

BlenderMCP：依赖Blender生成3D模型的MCP服务

综合介绍 BlenderMCP 是一个开源工具，它通过 Model Context Protocol (MCP) 协议将 Blender 与 Claude AI 连接起来。用户可以用文字指令直接控制 ...

最新AI资源 # AI开源项目 # AI文本与图片转3D # MCP服务

1年前

0103.7K

PocketFlow：100行代码实现AI应用开发的极简框架

综合介绍 PocketFlow 是一个只有100行代码的轻量级AI应用开发框架，由 The-Pocket 团队开发并在 GitHub 上开源。它追求极简设计，核心代码控制在100行，没有任何外部依赖...

最新AI资源 # AI开源项目 # 智能体开发框架 # 知识图谱

1年前

0103.7K

AI Auto Free：使用自动化工具无限制使用AI IDE（如Cursor和Windsurf）

综合介绍 AI Auto Free 是一个强大的自动化工具，旨在帮助用户无限制地使用AI驱动的集成开发环境（IDE），如 Cursor 和 Windsurf 。该项目提供跨平台支持，并包含多种语言功能...

最新AI资源 # AI开源项目

2年前

0103.7K

MediaCrawler：多社交媒体平台内容、视频评论爬虫工具

综合介绍 MediaCrawler是一个专为开发者设计的社交媒体内容爬虫工具。通过提供一个强大的爬虫功能，它能够快速地从小红书、抖音、快手、B站、微博等社交平台抓取视频、图片、评论、点赞、转发等数据...

最新AI资源 # AI开源项目

2年前

0103.5K

Browser-Use：构建智能网页自动化工具，让AI智能体轻松操作浏览器

综合介绍 Browser-Use是一个创新的开源网页自动化工具，专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架，支持多种主流语言模型，包括GPT-4、Claud...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0103.4K

AIGCPanel：开源克隆数字人整合系统，一键部署免费数字人客户端

综合介绍 AigcPanel是一款面向所有用户的一站式AI数字人制作系统，采用electron+vue3+typescript技术栈开发，支持Windows系统一键部署。系统设计以用户友好为核心，即使...

最新AI资源 # AI开源项目 # AI数字人

2年前

0103.4K

AsrTools：语音转字幕工具，内置剪映、快手、必剪接口的轻量客户端

综合介绍 AsrTools是一款智能语音转文字工具，内置剪映、快手、必剪等大厂接口，无需GPU或繁琐配置，支持高效的多线程批处理。它基于PyQt5开发，界面美观且用户友好，能够输出SRT和TXT格式字...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

0103.3K

n8n-mcp-server：与n8n工作流交互的MCP服务工具

综合介绍 n8n-mcp-server 是一个开源项目，托管在 GitHub 上，由 Leonard Sellem 开发。它是一个 MCP（Model Context Protocol）服务工具，专门...

最新AI资源 # AI开源项目 # MCP服务

1年前

0103.2K

Unsloth：高效微调和训练大语言模型的开源工具

综合介绍 Unsloth 是一个开源项目，旨在提供高效的微调和训练大语言模型（LLMs）的工具。该项目支持多种知名模型，包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...

最新AI资源 # AI开源项目 # 大模型微调

1年前

0103.1K

Whisper Input：利用Groq免费且高速的语音转录文本服务

综合介绍 Whisper Input 是一个开源的语音转译工具，用户可以通过按下 Option 按钮开始录制语音，抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

0102.7K

AIstudioProxyAPI：无限使用 Gemini 2.5 Pro 模型 API

综合介绍 AIstudioProxyAPI 是一个开源项目，使用 Node.js 和 Playwright 技术，通过模拟 OpenAI API 的方式，将 Google AI Studio 网页版的...

最新AI资源 # AI开源项目 # 免费大模型API

1年前

0102.6K

Dia：生成超现实多人对话的文本转语音模型

综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音（TTS）模型，专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话，支持情感和语调控制，甚至能生成非语言表...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0102.6K

Tifa-DeepsexV2-7b-MGRPO：支持角色扮演和复杂对话的模型，性能超越32b（附一键安装包）

综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型，专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化，具有卓越的文本生成和对话能力...

最新AI资源 # AI开源项目 # AI角色扮演

1年前

0102.5K

Fabric：集成众多提示词的AI开源工作流框架，高效处理各种事务

综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架，旨在简化和自动化日常计算机任务，使人工智能更易于使用。它通过模块化设计和预设提示词（Patterns）帮助用户高效...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

2年前

0102.4K

Kolors Virtual Try On：高效的虚拟试穿/模特换装，文本到图像生成模型

综合介绍 Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术，帮助用户在虚拟环境中试...

最新AI资源 # AI开源项目 # AI换脸与换装

2年前

0102.4K

优化代码生成和展示的Open WebUI

综合介绍 Open WebUI Artifacts Overhaul 是基于 Open WebUI 的一个分支项目，由开发者 Nick Tonjum 开发。它是一个开源工具，专注于提升 AI 生成代码...

AI新闻 # AI开源项目 # AI本地化聊天应用

1年前

0102.1K

TimesFM 2.0：谷歌开源进行时间序列预测的预训练模型

综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型，专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...

最新AI资源 # AI开源项目

2年前

0102.1K

RD-Agent：自动化数据驱动研发工具，通过AI技术推动以数据为导向的研发过程

综合介绍 RD-Agent是由微软推出的一款开源工具，旨在自动化和优化研究与开发（R&D）过程。该工具专注于数据驱动的场景，通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...

最新AI资源 # AI开源项目 # 智能体应用

1年前

0102K

DUIX：实时互动的智能数字人，支持多平台一键部署

综合介绍 DUIX（Dialogue User Interface System）是由硅基智能创建的AI驱动的数字人交互平台。通过开源数字人交互功能，开发者可以轻松集成大规模模型、自动语音识别（ASR...

最新AI资源 # AI开源项目 # AI数字人

2年前

0102K

Sonic：音频驱动肖像图片生成面部表情生动的数字人口播视频

综合介绍 Sonic 是一个专注于全球音频感知的创新平台，旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发，利用音频信息来控制面部表情和头部运动，从而生成自然流畅的动画视频。S...

最新AI资源 # AI开源项目 # AI数字人

1年前

0102K

Llasa 1~8B：高品质语音生成和克隆的开源文本转语音模型

综合介绍 Llasa-3B是由香港科技大学音频实验室（HKUST Audio）开发的一个开源文本转语音（TTS）模型。该模型基于Llama 3.2B架构，经过细致调优，提供高质量的语音生成，不仅支持多...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

0101.9K

CFG-Zero-star：提升图像和视频生成质量的开源工具

综合介绍 CFG-Zero-star 是一个开源项目，由 Weichen Fan 和南洋理工大学 S-Lab 团队开发。它专注于改进流匹配模型中的分类器自由引导（CFG）技术，通过优化引导策略和零初始...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # AI视频生成工具

1年前

0101.9K

Qwen-Agent：基于Qwen的智能代理应用框架，包括工具调用、代码解释器、RAG和Chrome扩展。

综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架，具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用，如浏览器助手、代码解释器和自定义助手...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

0101.8K

MTEB：评估文本嵌入模型性能的基准测试

综合介绍 MTEB（Massive Text Embedding Benchmark）是一个由 embeddings-benchmark 团队开发并托管在 GitHub 上的开源项目，旨在为文本嵌入模...

最新AI资源 # AI开源项目

1年前

0101.7K

LHM：从单张图片生成支持动作的3D人体模型

综合介绍 LHM（Large Animatable Human Reconstruction Model）是一个开源项目，它由aigc3d团队开发，能从一张图片快速生成支持动作的3D人体模型。核心特色...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

0101.7K

MangaNinjia：自动化线稿上色工具，为动漫黑白线稿快速填色

综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室（Ali-Vilab）开发的一个开源项目，专注于线稿上色的自动化处理。这一工具通过深度学习技术，实现了对参考图像的精确色彩匹配，极大地提高...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

0101.6K

DiffRhythm(谛韵)：10秒内生成最长4分45秒的歌曲

综合介绍 DiffRhythm 是由 ASLP-lab（西北工业大学音频、语音与语言处理小组）开发的一个开源项目，专注于通过人工智能技术实现端到端的音乐创作。它基于潜扩散模型（Latent Diffu...

最新AI资源 # AI开源项目 # AI音乐

1年前

0101.6K

Gemini Teacher：英语口语发音纠正助手

综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音，并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力，通...

最新AI资源 # AI开源项目 # AI教育工具

1年前

0101.5K

加载更多