AI开源项目

共 1020 篇文章

排序

浏览收藏

R1-Omni：通过视频和音频分析情感的开源模型

综合介绍 R1-Omni 是 HumanMLLM 团队在 GitHub 上推出的开源项目。它首次将强化学习与可验证奖励（RLVR）技术应用于多模态大语言模型，专注于情感识别。项目通过分析视频和音频数据...

最新AI资源 # AI开源项目

1年前

084.1K

magic-html：从HTML网址中提取主体数据，输出纯文本/markdown

综合介绍 magic-html是一个Python库，旨在简化从HTML中提取主体区域内容的过程。无论处理的是复杂的HTML结构还是简单的网页，这个库都旨在为用户提供一个便捷高效的接口。它支持多模态抽取...

最新AI资源 # AI开源项目

2年前

084K

TryOffAnyone：从人物身上提取服装为平铺服装展示图的AI工具

综合介绍 TryOffAnyone是一款突破性的AI图像处理工具，专门用于解决电商领域中服装展示的难题。它能够将真人穿着状态下的服装照片智能转换为平铺展示效果图，这项技术基于最新的Latent Dif...

最新AI资源 # AI开源项目 # AI换脸与换装

2年前

084K

Agent Inbox：与AI智能体进行人机交互的管理界面

综合介绍 Agent Inbox是由LangChain团队开发的一个开源项目，旨在提供一种新的用户体验，用于与AI智能体进行交互。该项目允许用户通过一个集中的界面管理和优化与多个AI智能体的交互。Ag...

最新AI资源 # AI开源项目

2年前

084K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR（光学字符识别）库，能够将文档转换为 Markdown 格式。该库由 Nutlope 开发，使用 Together...

最新AI资源 # AI开源项目 # OCR # 免费大模型API

2年前

084K

BrownChat：开源实时语音聊天的AI助手

综合介绍 BrownChat 是一个基于大型语言模型（LLM）技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发，旨在通过先进的自然语言处理技术提升用户的沟通体验。B...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

084K

AutoFlow：基于GraphRAG的对话式知识库/网页深度搜索工具，对话框可集成到其他网站

综合介绍 AutoFlow 是由 PingCAP 开发的开源工具，旨在通过 TiDB 无服务器向量存储构建基于图的知识库。它集成了 LlamaIndex 和 DSPy 框架，支持复杂的对话搜索和知识图...

最新AI资源 # AI客服机器人 # AI开源项目 # 知识图谱

2年前

084K

TripoSF：快速生成高分辨率3D模型的实用工具

综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目，专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术，处理效率高，能在普...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

083.9K

DeepSeek-RAG-Chatbot：本地运行的 DeepSeek RAG 聊天机器人

综合介绍 DeepSeek-RAG-Chatbot 是一个基于 DeepSeek R1 模型构建的开源聊天机器人项目，托管于 GitHub，由开发者 SaiAkhil066 创建。它结合了检索增强生成...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

083.9K

AI-ClothingTryOn：基于 Gemini 的虚拟服装试穿工具

综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序，由开发者 speedTD 创建，托管在 GitHub 上。它利用 Google Gemini 人工智能技术，让...

最新AI资源 # AI开源项目 # AI换脸与换装

1年前

083.8K

Base Chat：基于 Ragie 构建知识库的多租户聊天机器人

综合介绍 Base Chat 是一个多租户聊天机器人，使用 Ragie Connect 连接并与组织的知识库进行对话。该项目是 Ragie 多项功能的参考应用，基于 Next.js 构建，支持 Goo...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

083.8K

FitDiT：高保真度AI虚拟试衣工具，提升服装细节真实性

综合介绍 FitDiT是一个基于扩散变换器(Diffusion Transformers)的高保真虚拟试衣系统。该项目由腾讯AI Lab开发，旨在解决传统虚拟试衣系统在展示服装细节时的局限性。FitD...

最新AI资源 # AI开源项目 # AI换脸与换装

2年前

083.8K

Tap4 AI WebUI：开源轻量级AI工具导航项目

综合介绍 Tap4 AI WebUI 是一个开源的轻量级AI工具导航网站项目，旨在帮助用户轻松搭建自己的AI工具目录。该项目采用了Next.js和Supabase技术栈，支持多语言SEO优化，提供AI...

最新AI资源 # AI副业赚钱项目 # AI开源项目

2年前

083.7K

Deep Research：基于AI的深度研究助手，提供高效的研究工具和报告生成功能

综合介绍 Deep Research是一个基于AI的研究助手，旨在通过结合搜索引擎、网页抓取和大语言模型，进行迭代的深度研究。该项目由dzhng在GitHub上发布，目标是提供一个简单易用的深度研究代...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

083.7K

Dolphin：面向亚洲语言识别与语音转文本模型

综合介绍 Dolphin 是由 DataoceanAI 和清华大学合作开发的一个开源模型，专注于亚洲语言的语音识别和语言识别。它支持东亚、南亚、东南亚及中东地区的 40 种语言，以及 22 种中国方言...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

083.7K

OpenHealthForAll：个人健康数据管理AI助手，上传检查报告定制健康计划

综合介绍 OpenHealthForAll 是一个开源项目，旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术，OpenHealthForAll 提供了一个本地运行的健康助手，帮助用户更好地管理...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

083.7K

CodeWeaver：将代码结构和内容自动生成Markdown文档

综合介绍 CodeWeaver 是一个命令行工具，旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录，生成项目文件层次结构的结构化表示，并在代码块中嵌入每个文件的内容。这款工具...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

083.6K

VimLM：本地LLM驱动的Vim编程助手，安全离线的智能编程

综合介绍 VimLM是一个Vim插件，提供了一个由本地LLM（大语言模型）驱动的代码助手。通过Vim命令与本地LLM模型交互，自动获取代码上下文，帮助用户在Vim中进行代码编辑。VimLM的设计灵感来...

最新AI资源 # AI开源项目 # AI编程

1年前

083.6K

自动解析PDF内容并提取文字与表格的开源服务

综合介绍它能自动分析PDF文档的布局，识别页面中的文字、标题、图片、表格、公式等元素，并判断它们的正确顺序。工具支持OCR功能，可以把扫描PDF转为可搜索文本。它基于Docker运行，提供两种模型...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

1年前

083.5K

GraphGen：利用知识图谱生成合成数据微调语言模型

综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架，托管于 GitHub，专注于通过知识图谱指导合成数据生成，优化大语言模型（LLM）的监督微调。它从...

最新AI资源 # AI开源项目 # 大模型微调 # 知识图谱

1年前

083.4K

Kreuzberg：从任何文档中提取文本的开源工具

综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库，旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG（Retrieval-Augmented Generatio...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

083.4K

csm-mlx：苹果设备专用的 csm 语音生成模型

综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架，专门为苹果芯片（Apple Silicon）优化了 CSM（Conversation Speech Model）语音对话模型。这个项目让用...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

083.4K

NVIDIA联合LangChain推出：分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

综合介绍这是一个由LangChain和NVIDIA联合开发的结构化报告生成蓝图项目，展示在GitHub上的Jupyter notebook教程。该项目利用先进的AI技术，特别是Llama-3.3-7...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

083.4K

Memora：构建人性化AI记忆模块，保存并更新与人类的互动信息

综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能，帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户，能够处理...

最新AI资源 # AI开源项目 # 知识图谱

2年前

083.3K

Pieces OS：逆向Pieces-OS GRPC转换为OpenAI接口（失效）

综合介绍 Pieces-OS 是一个开源项目，旨在将 Pieces-OS 的 GRPC 流逆向并转换为标准的 OpenAI API 接口,支持Claude、GPT、Gemini。该项目由 Nekohy...

最新AI资源 # AI开源项目 # 免费大模型API

2年前

083.3K

Napkins.dev：基于Llama4上传线框图生成前端代码

综合介绍 Napkins.dev 是一个免费的开源项目，核心功能是让用户上传界面截图或线框图，自动生成可运行的前端代码。用户只需提供一张设计图，工具会通过 Llama 4 模型（由 Together ...

最新AI资源 # AI开源项目 # AI页面设计

1年前

083.3K

DeepGEMM：高效支持FP8矩阵运算的开源库（DeepSeek 开源周第三天）

综合介绍 DeepGEMM 是一个由 DeepSeek 团队开发的开源 FP8 GEMM（通用矩阵乘法）库，专注于提供高效的矩阵运算支持。它特别针对 NVIDIA Hopper 架构的 Tensor ...

最新AI资源 # AI开源项目

1年前

083.3K

Open Operator：通过AI智能体在云浏览器中执行自动化操作

综合介绍 Open Operator 是一个开源项目，旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发，结合了 Stagehand 和 Browserbase 的技术...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

083.3K

TextDistiller：一键总结一整本书，高效提炼书籍内容，快速掌握核心思想

综合介绍 TextDistiller 是一款先进的人工智能驱动工具，旨在对书籍进行逐章或整体总结，提供简洁而全面的概述。通过使用 TextDistiller，用户能够快速掌握任何书籍的核心思想和关键要...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

083.3K

Open Deep Research：生成基于网络搜索内容的AI研究报告

综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具，作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发，基于Next.js 1...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

083.2K

集成多种先进语音合成服务的开源运营项目

综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台，由 ItusiAI 团队开发。它支持超过 50 种语言，可以将文字转为自然语音，还能通过上传音频克隆个性化声音。项目整合了 Ope...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI文本转语音

1年前

083.2K

3FS：提升数据访问效率的并行文件系统（DeepSeek 开源周第五天）

综合介绍 3FS（Fire-Flyer File System）是由DeepSeek团队开发的一款开源并行文件系统，专为现代SSD和RDMA网络设计，旨在大幅提升数据访问效率。它在180节点集群中实现...

最新AI资源 # AI开源项目

1年前

083.2K

基于Workers AI免费将多种文件转为Markdown格式

综合介绍 serverless-markdown-convertor 是一个免费的开源工具，基于 Cloudflare Worker 和 Workers AI 开发，能将多种文件转换为 Markdow...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

083.2K

OpenSearch-SQL：将自然语言转为SQL查询的开源工具

综合介绍 OpenSearch-SQL 是一个开源项目，它是一个强大的 Text-to-SQL 工具，可以把用户的自然语言描述转化为 SQL 查询语句，帮助不熟悉数据库的人轻松获取数据。这个项目由 O...

最新AI资源 # AI开源项目 # AI数据分析

1年前

083.2K

小半 WordPress AI 助手：实现对话、文章生成与翻译的 WordPress AI助手插件

综合介绍 WordPress AI助手插件（wp-ai-chat）是一个开源的WordPress插件，旨在为用户提供多种AI功能，包括AI对话、文章生成、文章总结、文章翻译和内容朗读。该插件支持对接多...

最新AI资源 # AI写作 # AI开源项目

1年前

083.2K

Charla：基于终端的极简AI聊天工具，本地集成Ollama后端

综合介绍 Charla 是一个基于终端的聊天应用程序，旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端，支持上下文感知的对话，并将聊天会话保存为 Markdown 文件。用户可以通过简...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

083.1K

Shandu：多轮收集分析信息的AI研究自动化工具

综合介绍 Shandu 是一个基于人工智能的开源研究系统，托管在GitHub上，由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术，旨在为用户提供自动化、全面且...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

083.1K

ANUS：任务自动化与多代理协作的开源 AI 框架

综合介绍 ANUS（Advanced Neural Understanding System，高级神经理解系统）是一个托管在 GitHub 上的开源 AI 代理框架，由用户 nikmcfly 通过提示...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

083.1K

LocalGPT：在本地设备上与多文档对话，确保数据隐私

综合介绍 LocalGPT是一个开源项目，旨在让用户在本地设备上与文档进行对话，确保数据隐私。通过使用各种开源模型，LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

083K

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目，旨在通过集成空间编织注意力机制（Spatial Knitting Attentions）在扩散模型中嵌入高层次和高保真条...

最新AI资源 # AI图像转视频 # AI开源项目 # AI视频转换风格

2年前

082.9K

HealthGPT：支持医学图像分析与诊断问答的医疗大模型

综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型，旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中，显著提升了医疗图...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

082.9K

Humanify：借助AI快速解密和美化JavaScript代码的工具

综合介绍 Humanify 是一个开源工具，托管于 GitHub，由开发者 Jesse Luoto 创建，旨在帮助程序员利用人工智能技术快速解密和美化混淆的 JavaScript 代码。它集成了 Ch...

最新AI资源 # AI开源项目

1年前

082.9K

AudioNotes：快速提取音视频内容并生成结构化笔记

综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容，并调用大模型进行整理，生成一份结构化的 Markdown 笔记，方便用...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

082.8K

Exa & Deepseek Chat App：实时Web搜索与智能推理的开源聊天应用

综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用，主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

082.8K

RSS Translator（RSS翻译器）：订阅并实时翻译RSS内容的工具

综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具，旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎，包括Google Translate、Microsoft Tra...

最新AI资源 # AI开源项目 # AI翻译

1年前

082.8K

H2O GPT：灵活配置的本地AI对话与文档处理工具

综合介绍 H2O GPT 是一个开源项目，旨在提供私有化的聊天和文档处理功能。该项目基于 Apache 2.0 许可证，支持多种 GPT 模型，包括 LLaMa2、Mistral、Falcon 等。用...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

082.8K

Markdown To Poster：将Markdown转换为社交媒体/小红书海报，支持在线编辑和一键部署。

综合介绍 Markdown to Image 是一个用于将Markdown文本渲染为视觉上吸引人的社交媒体图片的React组件。该项目还包括一个内置的网页编辑器，可以作为在线Markdown到海报编辑...

最新AI资源 # AI开源项目

2年前

082.8K

FastAPI DocGPT：基于FastAPI的PDF文档处理和问答系统

综合介绍 FastAPI DocGPT 是一个基于 FastAPI 的文档问答系统，允许用户上传 PDF 文件并基于文档内容进行问答。该系统使用 OpenAI 的嵌入技术将文档内容嵌入到向量数据库 Q...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

082.8K

LongWriter：智谱推出生成超长文本的强大模型，支持一次对话生成10000+字

综合介绍 LongWriter是由清华大学数据挖掘研究组（THUDM）开发的一款强大的长文本生成工具。该工具基于先进的长上下文语言模型（LLM），能够生成超过10000字的长文本。LongWriter...

最新AI资源 # AI开源项目

2年前

082.7K

Diffbot GraphRAG LLM：依赖外部实时知识图谱数据的LLM推理服务

综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统，它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱（Knowledge Graph）与检索增强生成...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

082.6K

Supermemory：导入书签和网页内容构建个人知识库

综合介绍 Supermemory 是一个开源项目，旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术，让用户能够轻松保存、组织和检索来自网页、Twitter书签...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

082.6K

Aana SDK：简易部署多模态AI模型的开源工具

综合介绍 Aana SDK 是一个开源框架，由 Mobius Labs 开发，名字源于马拉雅拉姆语“ആന”（大象）。它帮助开发者快速部署和管理多模态 AI 模型，支持处理文本、图像、音频和视频等多种数...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

1年前

082.6K

OpenDeepSearch：支持智能推理的开源搜索工具

综合介绍 OpenDeepSearch 是一个开源的搜索工具，由 sentient-agi 团队开发。它结合了大型语言模型（LLM）和智能推理代理，让用户可以用简单的方式搜索网页信息并获取准确答案。这...

最新AI资源 # AI开源项目 # AI搜索工具

1年前

082.5K

Artab：在浏览器打开的新标签页中展示世界名画，Chrome插件

综合介绍 Artab 是一个浏览器扩展程序，旨在每次打开新标签页时展示世界上最伟大的艺术作品。该扩展程序适用于 Chrome、Edge 和 Firefox 浏览器。通过 Artab，用户可以在日常浏览...

最新AI资源 # AI开源项目

2年前

082.5K

PrivateGPT：完全本地化RAG处理流程的文档问答系统

综合介绍 PrivateGPT是一个可用于生产环境的AI项目，允许用户在没有互联网连接的情况下，使用大型语言模型（LLMs）对文档进行问答。该项目确保100%的数据隐私，所有数据都在用户的执行环境中处...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

082.5K

检测MCP服务安全风险的开源工具

综合介绍 mcp-is-dangerous 是 Shaojie Jiang 在 GitHub 上开发的一个开源工具。它通过简单的 Python 代码，帮助用户检测 MCP（Model Context ...

最新AI资源 # AI开源项目 # MCP服务

1年前

082.5K

Describe Anything：为图像和视频区域生成详细描述的开源工具

综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目，核心是 Describe Anything Model（DAM）。这个工具能根据用户在图像或视频中标记的...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

082.5K

SimGRAG：利用相似子图进行知识图谱驱动的检索增强生成

综合介绍 SimGRAG（SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

082.5K

Model Context Provider CLI：任意大模型中使用MCP服务的命令行工具，不依赖Claude

综合介绍 Model Context Provider CLI（mcp-cli）是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...

最新AI资源 # AI开源项目 # MCP服务

1年前

082.4K

DeepSeek-R1-FP4：FP4优化版DeepSeek-R1推理速度25倍

综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型，基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...

最新AI资源 # AI开源项目

1年前

082.4K

Groq AppGen：使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器，由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...

最新AI资源 # AI开源项目

2年前

082.4K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

综合介绍 Podcastfy 是一个开源的 Python 软件包，利用生成式人工智能（GenAI）技术，将网页内容、PDF 文件、文本、图像、youtube 视频等多种来源的内容转换为引人入胜的多语言...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

082.4K

Open MCP Client：网页版MCP客户端，快速连接任意MCP服务

综合介绍 Open MCP Client 是一个开源工具，最大的亮点是提供网页版 MCP（Model Context Protocol）客户端，让用户无需安装即可连接任意 MCP 服务器进行聊天。它还...

最新AI资源 # AI开源项目 # MCP服务

1年前

082.3K

dsRAG：用于处理非结构化数据和复杂查询的检索引擎

综合介绍 dsRAG是一款高性能检索引擎，专门用于处理非结构化数据的复杂查询。它在处理密集文本（如财务报告、法律文件和学术论文）中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能：语...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

082.3K

Go-Proxy：Docker集成的高性能反向代理服务器

综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器，主要用于在不同网络环境中提供代理服务。它支持多种协议，包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP，能...

最新AI资源 # AI开源项目

1年前

082.3K

HiveChat：适合公司内部快速部署的AI聊天机器人

综合介绍 HiveChat 是一个为中小型团队设计的 AI 聊天机器人，允许管理员一次性配置多种 AI 模型（如 Deepseek、OpenAI、Claude 和 Gemini），方便团队成员使用。它...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

082.3K

InspireMusic：阿里开源的统一音乐、歌曲和音频生成框架

综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包，专注于音乐、歌曲和音频生成。它提供了一个统一的框架，通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。Inspire...

最新AI资源 # AI开源项目 # AI音乐

1年前

082.3K

UIGEN-T1-Qwen-7b：生成HTML和CSS UI组件的专用模型

综合介绍 UIGEN-T1 是一个拥有 70 亿参数的 Transformer 模型，它基于 Qwen2.5-Coder-7B-Instruct 进行微调，专为基于推理的 UI 生成而设计。它利用复杂...

最新AI资源 # AI开源项目

1年前

082.3K

BotSharp：基于.NET的多智能体AI应开发与管理平台

综合介绍 BotSharp是基于.NET Core的一个开源项目，致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程，支持跨平台操作，旨在简化机器学习算法的应用，使企业级开发者能够高效地将...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

082.2K

TPO-LLM-WebUI：输入问题即可实时训练模型输出结果的AI框架

综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目，通过直观的 Web 界面实现大语言模型（LLM）的实时优化。它采用 TPO（Test-Time Pr...

最新AI资源 # AI开源项目 # 大模型微调

1年前

082.2K

Ovis：视觉与文本对齐模型，精准反推图像提示词

综合介绍 Ovis（Open VISion）是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型（MLLM），托管于 GitHub。该模型采用创新的结构嵌入对齐技术，将视...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

1年前

082.2K

Simba：收纳文档的知识管理系统，无缝集成到任何RAG系统

综合介绍 Simba是一个便携式知识管理系统（KMS），旨在与任何检索增强生成（RAG）系统无缝集成。该项目由GitHub用户GitHamza0206创建，提供了一种高效的知识管理解决方案，适用于各种...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

082.2K

Deep Research Web UI：支持多语言深度研究的AI助手

综合介绍 Deep Research Web UI 是一个基于AI技术的开源研究助手工具，旨在帮助用户对任何主题进行深度的迭代研究。它结合了搜索引擎、网页抓取和大型语言模型的能力，通过直观的Web界面...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

082.2K

llms.txt Generator：快速抓取网站内容并，生成LLM训练文本数据集

综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具，专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发，采用 @firec...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

082.1K

SVLS：SadTalker增强版，使用人像视频生成数字人

综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形，并使用可配置的面部区域增强方式来提高生成唇形的清晰度...

最新AI资源 # AI开源项目 # AI数字人

1年前

082K

Coding-Tutor：提供个性化编程指导的智能教学助手

综合介绍 Coding-Tutor 是一个托管在 GitHub 上的开源项目，由开发者 iwangjian 创建，旨在为学习者提供个性化的编程教学体验。它通过对话式人工智能技术，根据用户的知识背景和学...

最新AI资源 # AI开源项目 # AI教育工具

1年前

082K

Gemini Search：Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发，致力于复制 Perplexity 搜索引擎...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

082K

Instructor：简化大语言模型结构化输出工作流的Python库

综合介绍 Instructor 是一个流行的 Python 库，专为处理大语言模型（LLMs）的结构化输出而设计。它基于 Pydantic 构建，提供了一个简单、透明且用户友好的 API，用于管理数据...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

082K

WhoDB：支持自然语言交互的轻量数据库可视化管理软件

综合介绍 WhoDB 是一个轻量级（约20MB）、功能强大且用户友好的数据库管理工具，旨在简化数据库管理任务。它结合了 Adminer 的简洁性，并在用户体验和性能上进行了增强。WhoDB 使用 Go...

最新AI资源 # AI开源项目 # AI数据分析

2年前

082K

Chunkr：使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

综合介绍 Chunkr 是一个自托管的 API，专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG（检索增强生成）和 LLM（大语言模型）使用的数据。该项目由 Lumina...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

2年前

081.9K

DevDocs：快速抓取并整理技术文档的MCP服务

综合介绍 DevDocs 是一个完全免费的开源工具，由 CyberAGI 团队开发，托管在 GitHub 上。它专为程序员和软件开发者设计，能从技术文档的网址开始，自动爬取相关页面并整理成简洁的 Ma...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

1年前

081.9K

Search o1：赋予推理模型主动搜索能力，让大模型边思考边搜索外部知识

综合介绍 Search-o1 是一个开源项目，旨在通过整合高级搜索机制来增强大规模推理模型（LRMs）的性能。其核心思想是通过动态的搜索和知识整合来解决推理过程中遇到的知识缺失问题。该项目由 sunn...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

081.9K

CRCT：递归分解大型代码任务并持久保存项目状态

综合介绍 Cline Recursive Chain-of-Thought System（简称CRCT）是一个开源框架，专为在VS Code中管理大型代码项目而设计。当前版本为v7.0，它通过递归方式...

最新AI资源 # AI开源项目

1年前

081.9K

STORM：基于Topic搜索网络数据，生成带引用的论文、长文报告

综合介绍 STORM是由斯坦福大学 Oval 团队开发的一个知识整合和文章生成系统。它专注于从头开始生成类似维基百科的详尽文章（成体系的论文）。系统利用大型语言模型进行话题研究，准备概要并模拟实际互联...

最新AI资源 # AI开源项目 # 生成深度研究报告 # 论文

1年前

081.9K

WikiChat：使用维基百科数据检索知识的聊天工具

综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人，旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型（如ChatGPT和GPT-4）在处理最新信息或不太流行的话题时，往往...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

081.8K

Crawl4LLM：为LLM预训练提供的高效网页爬取工具

综合介绍 Crawl4LLM 是一个由清华大学和卡内基梅隆大学联合开发的开源项目，专注于优化大模型（LLM）预训练的网页爬取效率。它通过智能选择高质量网页数据，显著减少无效爬取，号称能将原本需要爬取1...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

081.8K

ComfyUI Portrait Master 中文版：优化肖像生成的提示词工具

综合介绍 ComfyUI Portrait Master 中文版是一个专为AI图像创作者设计的人物肖像提示词生成工具。该工具通过优化提示词，帮助用户生成高质量的人物肖像。用户可以根据需求选择不同的镜头...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

2年前

081.8K

TrendPublish：实时追踪并总结AI新闻，自动发布到微信公众号

综合介绍 ai-trend-publish 是一个在 GitHub 上托管的开源项目，由 OpenAISpace 团队开发，专注于实时追踪和发布人工智能领域的最新趋势。这个工具旨在帮助开发者、技术爱好...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

081.8K

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器

综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现，适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确...

最新AI资源 # AI开源项目 # AI文本转视频

2年前

081.7K

FlipSketch：将静态绘图转换为文本引导的草图动画，简化动画制作过程。

综合介绍 FlipSketch 是一个开源项目，旨在将静态绘图转换为文本引导的动画。该项目托管在 GitHub 上，提供了一个创新的工具，允许用户通过文本描述来生成动画效果。FlipSketch 结合...

最新AI资源 # AI图像转视频 # AI开源项目

2年前

081.7K

AI Web Operator：浏览器自动化操作，OpenAI Operator的开源实现

综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具，旨在通过集成多种 AI 技术和 SDK，简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

081.7K

AgentIQ：灵活连接和管理AI智能体的开源工具

综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具，旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作，连接企业数据和工具，像调用函数一样构建工作流。这个工具的最大...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

081.7K

PhiData：构建拥有记忆、知识和工具的AI智能体

综合介绍 PhiData是一个专为开发智能AI助手而设计的框架。它通过增强记忆、知识整合和工具调用能力，使AI助手能够进行长期对话、提供精准的业务上下文，并执行各种操作。PhiData不仅提升了AI助...

最新AI资源 # AI开源项目 # 智能体应用

1年前

081.6K

Awesome CursorRules：增强Cursor AI体验的规则集

综合介绍 awesome-cursorrules 是一个专门为 Cursor AI 提供自定义规则文件的项目。Cursor AI 是一个由人工智能驱动的代码编辑器，.cursorrules 文件可以定...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

2年前

081.6K

Morphic：AI驱动的开源搜索引擎，提供智能问答、视频搜索、生成UI代码

综合介绍 Morphic是一个基于AI技术的搜索引擎，采用生成式用户界面，旨在提供智能问答和高效搜索体验。用户可以通过Morphic进行多种搜索，包括文本、视频等，并能保存搜索历史，分享搜索结果。Mo...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

081.6K

Mini-Cover：在线封面制作，专为博客、短视频、社交媒体等生成个性化封面

综合介绍 Mini-Cover 是一个开源的在线封面生成工具，专为博客、短视频和社交媒体等平台生成个性化封面。该工具由 JLinMr 开发，旨在提供一个简洁高效的解决方案，帮助用户快速生成符合自己需求...

最新AI资源 # AI开源项目 # AI营销

2年前

081.6K

Thin-Plate-Spline-Motion-Model：静态人像图参考视频人像动作生成视频

综合介绍 Thin-Plate-Spline-Motion-Model是一个在CVPR 2022会议上发表的开创性图像动画生成项目。该项目基于薄板样条变换理论，能够将静态图像根据驱动视频实现高质量的动...

最新AI资源 # AI开源项目 # AI视频换脸

2年前

081.5K

TableGPT2：表格数据集成的多模态模型

综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型，专注于表格数据的集成和处理。该模型通过预训练和微调，能够在表格数据相关任务中表现出色，同时保持强大的通用语言和编码能力。TableGP...

最新AI资源 # AI开源项目

2年前

081.5K

AgentLaboratory：利用智能代理完成科研全流程的开源工具

综合介绍 AgentLaboratory 是一个开源工具，托管在 GitHub 上，由 Samuel Schmidgall 开发。它利用大语言模型（LLM）驱动的智能代理，帮助研究人员完成科研全流程...

最新AI资源 # AI开源项目 # AI教育工具 # 论文

1年前

081.4K

加载更多