AI开源项目

共 1020 篇文章

排序

浏览收藏

FireRedASR：多语言高精度语音识别开源模型

综合介绍 FireRedASR 是由小红书 FireRed 团队开发并开源的语音识别模型，专注于提供高精度、多语言支持的自动语音识别（ASR）解决方案。项目托管于 GitHub，面向开发者与研究者，提...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

0132.6K

OpenManus：MetaGPT推出的开源版Manus

综合介绍 OpenManus 是一个开源项目，旨在帮助用户通过简单配置在本地运行智能体，实现各种创意想法。它由 MetaGPT 社区的成员 @mannaandpoem、@XiangJinyu、@Mos...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

0130.9K

OpenSPG：开源知识图谱引擎

综合介绍 OpenSPG是由蚂蚁集团与OpenKG合作开发的开源知识图谱引擎，基于SPG（语义增强可编程图）框架。该引擎旨在提供显式语义表示、逻辑规则定义和操作框架等功能，支持领域知识图谱的构建和管理...

最新AI资源 # AI开源项目 # 知识图谱

2年前

0130.8K

Void：基于VSCode的开源Cursor替代品

综合介绍 Void是一个开源的Cursor替代品，基于vscode仓库的分支。它提供了一个强大的开发环境，旨在为开发者提供更高效的编码体验。Void的目标是通过社区贡献和快速迭代，不断提升其功能和稳定...

最新AI资源 # AI开源项目 # AI编程

2年前

0130.4K

Excalidraw：手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw 综合介绍 Excalidraw是一款开源的虚拟白板绘图工具，可以让您轻松地绘制具有手绘风格的图表。您可以使用Excalidraw创建美观的手绘风格的图解、线框图、或者任何您喜欢的...

最新AI资源 # AI开源项目 # AI白板与信息图

2年前

0130.1K

MakeSense：免费使用的图像标注工具，提升计算机视觉项目效率

综合介绍 Make Sense 是一个免费的在线图像标注工具，旨在帮助用户快速为计算机视觉项目准备数据集。它无需复杂安装，只需打开浏览器访问即可使用，支持多种操作系统，非常适合小型深度学习项目。用户可...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0129.9K

MLX-Audio：基于 Apple MLX 框架的文本转语音工具

综合介绍 MLX-Audio 是一个基于 Apple MLX 框架开发的开源工具，专注于文本转语音（TTS）和语音转语音（STS）功能。它充分利用 Apple Silicon（如 M 系列芯片）的强大...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0129.8K

Cursor Reset：重置 Cursor 0.45.x 以上版本设备标识的脚本

综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具，支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识...

最新AI资源 # AI开源项目

1年前

0129.7K

Evo2：支持基因组建模与设计的开源生物AI工具

综合介绍 Arc Institute Evo 2 是一个专注于基因组建模与设计的开源项目，由位于美国加州帕洛阿尔托的非营利研究机构 Arc Institute 开发，并与 NVIDIA 等合作伙伴协作...

最新AI资源 # AI开源项目

1年前

0129.3K

NocoDB：在多种数据库上创建智能表格，开源Airtable替代方案

综合介绍 NocoDB 是一个开源的Airtable替代方案，旨在提供一个强大且易于使用的在线数据库管理工具。通过NocoDB，用户可以轻松创建、读取、更新和删除数据库中的数据，无需编写代码。该平台支...

最新AI资源 # AI开源项目 # AI数据分析

2年前

0129.2K

LTX Video（LTXV）：生成高质量视频的实时视频生成开源模型

综合介绍 LTX-Video是由Lightricks开发的首个基于DiT（Diffusion Transformer）的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

2年前

0128.8K

Easy-Wav2Lip：高质量视频唇同步的工具，优化版Wav2Lip

综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具，旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式，支持 Google Colab 和本地安装。通过优化算法，Ea...

最新AI资源 # AI开源项目 # 口型同步

2年前

0128.4K

Sidekick CLI：一个开源的 Claude Code 替代工具

综合介绍 Sidekick CLI 是一个开源的命令行工具，旨在通过 AI 辅助简化开发者的项目开发和部署流程。它受到 Claude Code、Copilot 和 Cursor 的启发，提供类似的功能...

最新AI资源 # AI开源项目 # AI编程

1年前

0128.2K

Agent.exe：让AI直接控制你的电脑，Claude控制计算机的开源实现

综合介绍 Agent.exe 是一个开源的 Electron 应用程序，利用 Anthropic 的 Claude 3.5 Sonnet API，让用户可以通过 AI 直接控制本地计算机。该项目由 K...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0127.9K

Flux Gym：低显存训练FLUX LoRA的简易UI

综合介绍 Flux Gym是一个简易的网页用户界面，用于训练FLUX LoRA，支持低显存（12GB/16GB/20GB）。前端基于AI-Toolkit的Gradio UI，后端由Kohya Scri...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

0127.4K

RAGFlow：基于深度文档理解的开源RAG引擎，提供高效的检索增强生成工作流

综合介绍 RAGFlow 是一个开源的检索增强生成（RAG）引擎，基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流，结合了大型语言模型（LLM），能够提供基于复杂格式数据的真实...

最新AI资源 # AI开源项目 # 低代码工作流 # 知识检索与RAG框架

2年前

0127.2K

Onyx：连接企业知识库的智能AI聊天平台

综合介绍 Onyx（原名Danswer）是一个开源的AI聊天平台，由onyx-dot-app团队开发，旨在帮助企业整合和管理文档、应用及员工数据。它提供丰富的聊天功能，支持连接任意大语言模型（LLM...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

0127.2K

DeepChat：支持与多个聊天并发会话的AI对话客户端

综合介绍 DeepChat 是一个开源的智能助手项目，由 ThinkInAIXYZ 团队在 GitHub 上开发。它旨在通过强大的 AI 技术连接用户与数字世界，提供高效、自然的聊天体验。支持 Win...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0126.9K

KrillinAI：一键翻译和配音的视频多语言全球化工具

综合介绍 KrillinAI 是一个开源的视频处理工具，专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始，一直到生成适配不同平台的成品，全程只需几次点击。开发者在 GitHub 上提供了...

最新AI资源 # AI开源项目 # AI翻译

1年前

0126.7K

Chatbot UI：模仿ChatGPT界面和功能的开源AI聊天应用程序

综合介绍 Chatbot UI 是一个开源项目，旨在帮助开发者创建个性化的智能对话界面。该项目提供了一系列界面组件和交互功能，可以轻松集成到现有的Chatbot系统中，为用户提供更加流畅和智能的对话体...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

0126.5K

UI-TARS Desktop：使用自然语言控制电脑的桌面智能体应用

综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS（视觉语言模型）的图形界面代理应用。该应用允许用户通过自然语言来控制计算机，实现更直观和高效的人机交互。UI-TAR...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0125.7K

Cobalt：万能视频下载器，YouTube、Vimeo、Twitter、Reddit、SoundCloud等

综合介绍经常要下载YouTube和Twitter视频，所以找到了这款免费无广告的视频下载器。Cobalt 是一个开源的媒体下载工具，旨在提供用户友好的下载体验。它支持从多个平台下载视频和音频内容，包...

最新AI资源 # AI开源项目

2年前

0125.5K

Chat2DB：智能生成SQL与数据报表的数据库管理工具

综合介绍 Chat2DB 是一款由 CodePhiliaX 团队开发的开源数据库管理和SQL客户端工具，集成了AI功能，支持快速编写SQL查询、管理数据库、生成数据报表以及多数据库交互。它支持超过16...

最新AI资源 # AI开源项目 # AI数据分析

1年前

0125.2K

Continue：与VS Code集成并自定义模型和embedding的开源AI代码助手

综合介绍 Continue是一个开源的AI代码助手，旨在提高软件开发者的效率。其主要功能包括代码自动完成、代码优化和智能代码建议，适用于VS Code和JetBrains IDEs。Continue不...

最新AI资源 # AI开源项目 # AI编程

1年前

0125.2K

Coze on WeChat：将Coze（扣子）机器人接入微信

综合介绍 Coze on WeChat 是一个开源项目，旨在帮助用户将 Coze 平台的 AI 机器人无缝接入微信。它基于 chatgpt-on-wechat 和 dify-on-wechat 开发...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

0124.9K

Qlib：微软开发的AI量化投资研究工具

综合介绍 Qlib 是微软开发的一个开源平台，专注于用 AI 技术帮助用户研究量化投资。它从最基本的数据处理开始，支持用户探索投资想法并将其变成可用的策略。平台简单易用，适合想用机器学习提升投资研究的...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

0124.9K

Danswer：专注企业知识管理与文档搜索的AI助手，集成多种工作工具

综合介绍 Danswer是一个开源的企业文档检索AI助手，旨在通过智能聊天界面和统一搜索功能，连接到团队的文档、应用程序和人员，提供统一的搜索和自然语言查询答案。确保用户数据和聊天记录完全由用户控制...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

0124.8K

go-stock：AI赋能股票分析工具，自选股行情实时监控并基于AI深度分析

综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情，提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地，确保用户...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

0124.5K

BrowserTools MCP：实时监控浏览器活动的MCP服务

综合介绍 BrowserTools MCP 是一个开源项目，由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务，让 AI 能实时监控浏览器活动，包括日志、网络请求...

最新AI资源 # AI开源项目 # MCP服务

1年前

0124.2K

Eino：字节跳动开源的Golang大模型应用开发框架

综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架，旨在成为大模型（LLM）应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架...

最新AI资源 # AI开源项目

1年前

0124.1K

Tabby：可集成到 VSCode 的本地自托管AI编程助手

综合介绍 Tabby 是一个开源的 AI 编程助手，由 TabbyML 团队开发，用户可以自己部署在本地或服务器上。它提供类似 GitHub Copilot 的功能，比如代码自动补全和智能问答，但最大...

最新AI资源 # AI开源项目 # AI编程

1年前

0123.7K

Repomix：打包代码库为一个文本文件以便大模型检索

综合介绍 Repomix（前称Repopack）是一款开源工具，专门用于将整个代码库打包成一个单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型（如Claude、Chat...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

0122.9K

E2B：安全云沙箱中的AI代码运行平台

综合介绍 E2B是一个开源平台，专为在安全的云沙箱中运行AI生成的代码而设计。它支持多种编程语言和框架，提供了一个隔离的虚拟环境，确保代码执行的安全性和可靠性。E2B适用于各种AI应用场景，包括数据分...

最新AI资源 # AI开源项目

2年前

0122.6K

Watermark Removal：开源去除图像水印工具，图片去水印恢复原始图像

综合介绍 Watermark Removal 是一个开源项目，利用机器学习和深度学习技术进行图像修复，专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发，灵感来源于 Con...

最新AI资源 # AI开源项目 # AI抠图改背景

1年前

0122.6K

AI Hedge Fund：开源自动化交易系统，利用多智能体进行复杂对冲基金交易决策

综合介绍 AI Hedge Fund 是一个利用多代理系统进行交易决策的人工智能对冲基金。该系统通过多个专门的代理协同工作，包括市场数据代理、量化代理、风险管理代理和投资组合管理代理，以实现复杂的交易...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI金融数据分析

2年前

0122.4K

Agent S：像人类一样操作电脑的开源智能体框架

综合介绍 Agent S 是由 Simular AI 开发的开源框架，让智能体通过图形用户界面（GUI）像人类一样操作电脑。它使用多模态大语言模型和经验学习技术，能完成浏览网页、编辑文档、使用软件等任...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

0122.1K

F5-TTS：少样本语音克隆，生成流畅且感情丰富的克隆声音

综合介绍 F5-TTS 是一种新型非自回归文本到语音（TTS）系统，基于流匹配的扩散变换器（Diffusion Transformer, DiT）。该系统通过使用 ConvNeXt 模型来优化文本表示...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0122.1K

Langfuse：开源的 LLM 应用观测与调试平台

综合介绍 Langfuse 是一个开源的 LLM（大语言模型）工程平台。它帮助开发者追踪、调试和优化 LLM 应用，提供观测调用、管理提示词、运行实验和评估结果的工具。平台由 Langfuse 团队开...

最新AI资源 # AI开源项目

1年前

0121.7K

MaxKB：开箱即用的AI知识库问答系统，适合智能客服和企业内部知识库

综合介绍 MaxKB（Max Knowledge Base）是一款基于大语言模型和RAG（检索增强生成）的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

0121.4K

OmniSVG：从文本和图像生成SVG矢量图形的开源项目

综合介绍 OmniSVG 是一个开源项目，专注于通过多模态模型生成高质量矢量图形（SVG）。它利用预训练的视觉-语言模型，支持从文本描述或图像输入生成 SVG，涵盖简单图标到复杂动漫角色的多种场景。项...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

0121.3K

Mem0：为AI助手和代理提供智能记忆层的开源项目

综合介绍 Mem0（发音为“mem-zero”）是一个为AI助手和代理提供智能记忆层的开源项目。它能够记住用户偏好，适应个体需求，并随着时间的推移不断改进，使其成为客户支持聊天机器人、AI助手和自主系...

最新AI资源 # AI开源项目

2年前

0121.3K

Prompt Optimizer：优化主流AI模型提示词的开源工具

综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具，由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词，从而提升生成内容的质...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

0121.3K

AingDesk：个人电脑一键安装AI模型和聊天界面（含DeepSeek）

综合介绍 AingDesk是一款开源且免费的软件，旨在帮助用户轻松地在本地计算机上部署和运行各种AI模型。无论是 DeepSeek 还是 Llama 模型，AingDesk都能通过简单的操作步骤实现一...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0121.2K

RooFlow：基于 Roo Code 扩展的记忆增强系统

综合介绍 RooFlow 是一个开源的AI辅助编程工具，核心功能是通过项目记录保存开发过程中的代码、决策和任务进展。它基于Roo Code扩展，集成了五种模式：架构、编码、测试、调试和问答。这些模式互...

最新AI资源 # AI开源项目 # AI编程

1年前

0120.7K

Knowledge Graph Studio（WhyHow）：创建和管理知识图谱的开源平台，RAG应用原生支持

综合介绍知识图谱工作室（Knowledge Graph Studio）是一个开源平台，旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...

最新AI资源 # AI开源项目 # 知识图谱

2年前

0120.6K

Midscene.js：用AI驱动浏览器自动化测试的开源插件

综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具，能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本，简化了UI测...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0120.3K

Orpheus-TTS：生成自然中文语音的文本转语音工具

综合介绍 Orpheus-TTS 是一个开源的文本转语音（TTS）系统，基于 Llama-3b 架构开发，目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出，支持英语、西班牙语、法语...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0120K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库，具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发，旨在为需要快速、准确语音转文字的应用提供支持...

AI新闻 # AI开源项目 # AI语音转文本

2年前

0120K

RF-DETR：实时视觉对象检测开源模型

综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构，核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0119.7K

TRV：将幻灯片/PPT和讲解备注快速生成演讲视频

综合介绍 TRV 是一个开源工具，托管于 GitHub，旨在帮助用户将幻灯片和演讲笔记快速转化为带有旁白的视频。它通过简单的命令行操作，将输入的演示文稿文件自动生成音频和视频内容，适合需要快速制作演示...

最新AI资源 # AI开源项目 # AI视频生成工具

1年前

0119.7K

VITA：开源视觉与语音实时交互的多模态大语言模型

综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目，率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本，开创了首个开源交互式全模态大语言模型的先河。2024...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

0119.6K

Trend Finder：实时追踪社交媒体趋势、热门话话题和新原文，助力营销决策

综合介绍 Trend Finder 是一个强大的工具，旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子，Trend Finder 能够在检测到新趋势或产品发布时，及时发送...

最新AI资源 # AI开源项目 # AI社交媒体

2年前

0119.4K

Linly-Talker：数字人智能对话系统，结合大语言模型与视觉模型，实现互动新体验

综合介绍 Linly-Talker 是一个创新的数字人对话系统，结合了大语言模型（LLMs）与视觉模型，创造出一种新颖的人机互动方式。该系统集成了多种技术，如 Whisper、Linly、Micros...

最新AI资源 # AI开源项目 # AI数字人

1年前

0119.3K

Plate：AI驱动的富文本编辑器，支持丰富的插件扩展

综合介绍 Plate 是一个由 AI 驱动的富文本编辑器，基于 React 和 TypeScript 构建，旨在提供高度可定制和扩展的编辑体验。它利用 Slate.js 作为核心，结合了现代化的 UI...

最新AI资源 # AI写作 # AI开源项目

2年前

0119.3K

Crawl4AI：开源的异步网页爬虫工具，无需LLM提取结构化数据

综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具，专为大型语言模型（LLMs）和人工智能（AI）应用设计。它简化了网络爬虫和数据提取流程，支持高效的网页爬取，并提供对 LLM 友好的输出格式...

最新AI资源 # AI开源项目

2年前

0119.2K

WrenAI：对话式数据分析AI助手，直接获取答案、SQL查询与分析报表

综合介绍 WrenAI是一个开源的SQL AI助手，专门设计用于帮助数据团队、产品团队和业务团队通过自然语言对话的方式获取数据洞察。它能够将自然语言转换为SQL查询，生成图表、电子表格和报告，支持多语...

最新AI资源 # AI开源项目 # AI数据分析

2年前

0119.1K

LiteAvatar：音频驱动2D人像的实时互动数字人，CPU运行30fps

综合介绍 LiteAvatar 是由 HumanAIGC 团队（阿里旗下）开发的一款开源工具，专注于通过音频实时驱动2D虚拟形象生成面部动画。它仅依靠CPU就能以30帧每秒（fps）的速度运行，特别适...

最新AI资源 # AI开源项目 # AI数字人

1年前

0118.5K

RTranslator：语音实时翻译安卓应用，免费且支持离线使用

综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用，专为 Android 设备设计。用户可以通过连接蓝牙耳机，将手机放在口袋中，与他人进行如同对方说自己语言的对话。RTransla...

最新AI资源 # AI开源项目 # AI翻译

2年前

0118.3K

RealtimeVoiceChat：低延迟与AI进行自然口语对话

综合介绍 RealtimeVoiceChat 是一个开源项目，专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音，系统通过浏览器捕获音频，快速转为文字，由大型语言模型（LLM）生成回...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

0118.2K

DeepFace：实现面部年龄、性别、情绪、种族识别的轻量级Python库

综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析（包括年龄、性别、情绪和种族）的Python库。它集成了多种先进的面部识别模型，如VGG-Face、FaceNet、OpenFace、De...

最新AI资源 # AI开源项目

2年前

0118K

Graphiti：动态知识图谱构建和查询工具（具有时间感知的长记忆方案）

综合介绍 Graphiti是由 getzep 开发的一款用于构建和查询动态、时间感知的知识图谱的工具。它能够表示实体之间复杂且不断变化的关系，并通过时间、全文、语义和图算法等多种方法进行查询。Grap...

最新AI资源 # AI开源项目 # 知识图谱

1年前

0118K

Wan2.1：在消费级 GPU 上生成高质量视频

综合介绍 Wan2.1 是由 Wan-Video 团队开发并在 GitHub 上开源的一个视频生成工具套件，专注于通过人工智能技术推动视频创作的边界。它基于先进的扩散变换器架构，集成了独特的时空变分自...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

0117.2K

小红书AI运营助手：自动生成和发布小红书文章

综合介绍小红书AI运营助手（xhsaipublisher）是一个专为在小红书平台上发布文章而设计的自动化工具。该项目结合了图形用户界面与自动化脚本，利用大模型技术生成内容，并通过浏览器自动登录和发布...

最新AI资源 # AI副业赚钱项目 # AI开源项目

2年前

0117.2K

Nanobrowser：浏览器中实现任务自动化的多智能插件

综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展，旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具，用户只需提供自己的LLM...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

0117.2K

R2R：多模态内容解析并结合知识图谱与混合搜索的先进AI检索（RAG）系统

综合介绍 R2R（RAG to Riches）是一个先进的AI检索系统，支持检索增强生成（RAG）功能，具备生产就绪的特性。该系统基于容器化的RESTful API构建，提供多模态内容解析、混合搜索功...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

0116.8K

PDF Craft：PDF扫描文件转Markdown的开源工具

综合介绍 PDF Craft 是一个开源工具，专为扫描书籍的PDF设计，能将其转换为Markdown格式。它由 oomol-lab 开发，托管在 GitHub 上，适合喜欢整理电子书的用户。工具通过本...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

1年前

0116.6K

支持数据库查询的Dify插件

综合介绍 dify-plugin-tools-dbquery 是一个专为 Dify 1.0 平台设计的开源插件，由开发者 junjiem 在 GitHub 上发布。它提供数据库查询功能，帮助用户在构建...

最新AI资源 # AI开源项目

1年前

0116.5K

AudioX：参考文本、图像、视频生成音频和音乐

综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目，官方论文发布于 arXiv（编号 2503.10522）。它基于扩散变换器（Diffusion Transf...

最新AI资源 # AI开源项目 # AI音乐

1年前

0116.3K

Linly-Dubbing：智能视频多语言AI配音/翻译工具

综合介绍 Linly-Dubbing 是一个智能多语言AI配音和翻译工具，旨在通过整合先进的AI技术，为用户提供高质量的多语言视频配音和字幕翻译服务。该工具特别适用于国际教育、全球内容本地化等场景，帮...

最新AI资源 # AI开源项目 # AI翻译

2年前

0116.1K

SynthLight：对肖像图像进行自然光照渲染（未发布）

综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像，实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集，模拟不同光照条件下的光照转换...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

0116K

Agno：构建具备记忆、知识和工具的多模态智能体框架

综合介绍 Agno 是一个由 agno-agi 团队开发并托管于 GitHub 的开源 Python 库，致力于让开发者轻松构建具备记忆、知识和工具的 AI 智能体。它支持文本、图像、音频和视频等多模...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

0115.9K

n8n自托管AI入门套件：快速搭建本地AI环境的开源模板

综合介绍 n8n自托管AI入门套件是一个开源的Docker Compose模板，旨在快速初始化一个全面的本地AI和低代码开发环境。由n8n团队精心策划，该套件结合了自托管的n8n平台和一系列兼容的AI...

最新AI资源 # AI开源项目

1年前

0115.8K

CodeFormer：图像与视频面部复原，老照片修复，提供一键部署版

CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库，由南洋理工大学 S-Lab 的研究团队开发，并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器（C...

最新AI资源 # AI副业赚钱项目 # AI图像放大与修复 # AI开源项目

2年前

0115.7K

百聆 (Bailing)：低延时的开源语音对话助手，轻松实现自然对话交流

综合介绍百聆（Bailing）是一个开源的语音对话助手，旨在通过语音与用户进行自然的对话。该项目结合了语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术，实现了...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

0115.5K

HippoRAG：基于长时记忆的多跳知识检索框架

综合介绍 HippoRAG 是俄亥俄州立大学 OSU-NLP 小组开发的一个开源框架，灵感来源于人类长时记忆机制。它结合检索增强生成（RAG）、知识图谱和个性化 PageRank 技术，帮助大语言模型...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

0115.5K

Deep Live Cam：开源的实时AI换脸工具，一张照片就能实现实时换脸直播

综合介绍 Deep Live Cam 是一个开源的人工智能工具，旨在通过单张照片实现实时换脸和深度伪造视频生成。该工具利用先进的深度学习算法，能够在直播或视频通话中实时替换人脸，保护用户隐私并增加趣味...

最新AI资源 # AI开源项目 # AI视频换脸

2年前

0115.5K

OpenAvatarChat：模块化设计的数字人对话工具

综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目，托管在 GitHub 上。它是一个模块化的数字人对话工具，用户可以在单台 PC 上运行...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

0115.4K

LibreChat：模仿ChatGPT界面交互的AI对话开源项目

综合介绍 LibreChat是一个免费、开源的AI聊天平台，拥有广泛的自定义选项，并支持多种AI提供商、服务和集成。它以熟悉的界面和创新功能集合所有AI对话于一体，支持多重AI模型、插件和多语言。通过...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

0115.3K

Smolagents：快速开发AI智能体，轻量级构建智能体的开源项目

综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库，专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称，核心代码仅约1000行，却提供了强大的功能集成能力。它最...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

0115.3K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

综合介绍 MuseV是一个GitHub上的公共项目，旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术，并提供了Image2Video、Text2Image2Video、Video2Video...

最新AI资源 # AI开源项目 # AI数字人 # 口型同步

2年前

0115.1K

基于Cloudflare Worker的AI图片生成脚本

综合介绍 CloudFlare-AI-Image 是一个开源项目，托管在 GitHub 上，通过 Cloudflare Workers 平台提供免费的 AI 图像生成服务。它支持文生图和图生图功能，基...

最新AI资源 # AI开源项目 # 免费大模型API

1年前

0114.9K

InternVL：开源多模态大模型，支持图像、视频和文本处理

综合介绍 InternVL 是由上海人工智能实验室（OpenGVLab）开发的一个开源多模态大模型项目，托管在 GitHub 上。它集成了视觉和语言处理能力，支持图像、视频和文本的综合理解与生成。In...

最新AI资源 # AI开源项目

1年前

0114.8K

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

综合介绍 RMBG-2-Studio 是一款基于 BRIA-RMBG-2.0 模型开发的增强型背景移除和替换应用。该应用旨在为用户提供高效、准确的图像背景处理功能，适用于各种图像类型，包括电商、游戏和...

最新AI资源 # AI开源项目 # AI抠图改背景

2年前

0114.5K

AutoDev：支持多语言的自动代码生成与调试工具

综合介绍 AutoDev 是一个由 Unit Mesh 团队开发的开源项目，托管在 GitHub 上，旨在通过人工智能技术提升开发者的编程效率。它是一个功能强大的编码助手，支持多种编程语言，包括 Ja...

最新AI资源 # AI开源项目 # AI编程

1年前

0114.4K

ComfyUI-Copilot：文字描述生成 ComfyUI 工作流的AI助手

综合介绍 ComfyUI-Copilot是一个专为ComfyUI框架设计的AI驱动自定义节点，旨在通过自然语言交互提升AI算法调试与部署的效率。它由AIDC-AI团队（阿里巴巴）开发并开源于GitHu...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

1年前

0114.3K

CAD-MCP：通过自然语言指令控制CAD软件的MCP服务

综合介绍 CAD-MCP 是一个开源项目，允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术，让用户无需手动操作 CAD 界面，只需输入简单的文字命令即...

最新AI资源 # AI开源项目 # MCP服务

1年前

0114.3K

J.A.R.V.I.S.：具有上下文感知的智能代码助手，生成和修改代码，多IDE支持

综合介绍 J.A.R.V.I.S.（Just A Rather Very Intelligent System）是一个智能代码助手，旨在利用多种最先进的语言模型来帮助开发者进行代码生成、修改和技术讨论...

最新AI资源 # AI开源项目 # AI编程

2年前

0114.3K

NeoAI：让AI接管电脑远程操作，使用自然语言控制电脑的开源项目

综合介绍 NeoAI是一款创新的开源AI助手工具，它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码，用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

0114.2K

Cog-ComfyUI：使用API运行ComfyUI工作流

综合介绍 Cog-ComfyUI是一个开源项目，旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建，提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

2年前

0114K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换，采用Co...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

0114K

Goose：开源可扩展的编程智能体，自动化执行编程全流程任务

综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具，旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型（LLM），通过命令行或桌面应用接口与用户互动。Goose可以执行从代...

最新AI资源 # AI开源项目 # AI编程 # 智能体开发框架

2年前

0113.5K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

综合介绍 OpenAI Edge TTS 是一个开源项目，提供与 OpenAI 兼容的本地文本转语音（TTS）API。该项目使用 Microsoft Edge 的在线文本转语音服务，允许用户生成高质量...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

0113.4K

Amphion MaskGCT：零样本文本到语音克隆模型（本地一键部署包）

综合介绍 MaskGCT（Masked Generative Codec Transformer）是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音（TTS）模型。该模型无需显式的文本与...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

0113.2K

MatAnyone: 提取视频指定目标人像的开源工具，生成目标人像视频

综合介绍 MatAnyone 是一个专注于视频抠像的开源项目，由新加坡南洋理工大学 S-Lab 的研究团队开发并在 GitHub 上发布。它通过一致性记忆传播技术，为用户提供稳定高效的视频处理能力，尤...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

0113.1K

SP-MangaEditer：专业四格漫画插图创作工具，生成图像、编辑漫画页面

综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台，专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能，帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

0113K

Dify-WebUI：基于Dify API的桌面智能对话客户端，提供企业级AI对话能力

综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用，旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色，满足企业个性化需求，并且具备知识库管理功能，支...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

0112.8K

Local-NotebookLM：本地PDF生成语音播客的开源工具

综合介绍 Local-NotebookLM 是一个开源项目，旨在提供本地运行的智能文档处理与内容生成工具。它受到 Google NotebookLM 的启发，专注于帮助用户将 PDF 等文档转化为多种...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

0112.5K

bilive：B站无人监守直播录制与自动切片、上传工具

综合介绍 bilive是一个专为B站直播录制设计的工具，提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器，支持7x24小时无人值守录制，自动识别并渲染弹幕和字幕，自动切片并...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

0112.3K

Ragas：评估RAG召回QA准确率与答案相关性

综合介绍 Ragas是一个专门用于评估和优化检索增强生成（RAG）系统的工具。它通过分析查询、检索上下文和生成答案之间的关系，提供了一套全面的评估指标。这些指标包括忠实度、答案相关性、上下文相关性、上...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

0112K

加载更多