AI开源项目

共 1020 篇文章

排序

浏览收藏

Motia：用代码快速构建智能体的开发框架

综合介绍 Motia 是一个面向软件工程师的开源 AI 代理框架，托管在 GitHub 上，由 MotiaDev 团队开发。它让开发者能用熟悉的编程语言（如 Python、TypeScript、Rub...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

0101.5K

混元文生视频：生成写实镜头感的高质量视频，腾讯开源视频生成大模型

综合介绍腾讯混元文生视频（元宝 APP中可体验）是由腾讯推出的一款基于AI技术的视频生成平台。该平台利用腾讯混元大模型，具备强大的跨领域知识和自然语言理解能力，能够根据用户的文本描述生成高质量的视频...

最新AI资源 # AI开源项目 # AI文本转视频

2年前

0101.4K

Spark-TTS：生成自然语音的文本转语音工具

综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音（Text-to-Speech, TTS）工具，托管在 GitHub 上，旨在帮助用户将文本高效转换为自然流畅的语...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

0101.4K

AI投资系统：自动化A股投资决策系统，利用多智能体系统分析市场数据

综合介绍 A_Share_investment_Agent 是一个基于多智能体系统的A股投资决策辅助工具。该系统旨在通过多个协作智能体来分析市场数据、计算股票内在价值、分析市场情绪以及基本面数据，从而...

最新AI资源 # AI开源项目 # AI金融数据分析

2年前

0101.3K

OuteTTS：实验性文本转语音模型，使用纯语言建模方法实现的TTS

综合介绍 OuteTTS 是一种实验性文本转语音（TTS）模型，采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同，OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0101.3K

VLM-R1：通过自然语言定位图像目标的视觉语言模型

综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目，托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法，结合 Qwen2.5-VL 模型，通过强化学习...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0101.2K

Agent TARS：使用视觉和命令操作电脑的开源智能体

综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体，核心特点是通过视觉理解网页内容，并结合命令行和文件系统操作，帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作，而是能自...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

0101.2K

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

综合介绍 Clone Voice 是一个开源的声音克隆工具，提供了一个基于Web的界面，允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单，即使没有NVIDIA GPU，也可以通过预编译的应...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

0101K

InvSR：开源图像超分辨率项目，提升图像分辨率质量

综合介绍 InvSR是一个创新的开源图像超分辨率项目，它基于扩散反演技术，能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识，通过灵活的采样机制，支持...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

0100.9K

Scira（MiniPerplx）：模仿Perplexity的开源项目，集成AI对话、网页搜索、天气查询等功能

综合介绍 MiniPerplx（更名为Scira）是一个极简主义设计的AI驱动搜索引擎，它整合了多种实用功能，为用户提供全方位的信息检索服务。该项目采用现代化的技术栈，包括Next.js、Tailwi...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

0100.8K

OpenWebUI-Monitor：监控OpenWebUI用户活动，管理使用限额，支持一键部署。

综合介绍 OpenWebUI-Monitor 是一个用于监控 OpenWebUI 用户活动和管理使用限额的仪表板。它可以高效地设置用户配额，实时查看用户数据和可视化信息，支持一键部署，方便用户管理和监...

最新AI资源 # AI副业赚钱项目 # AI开源项目

2年前

0100.8K

codemcp：Claude Desktop专用的编码助手MCP

综合介绍 codemcp 是一个开源工具，专为 Claude Desktop 用户设计，由 Edward Z. Yang 在 GitHub 上开发。它能让 Claude Desktop 成为一个实用的...

最新AI资源 # AI开源项目 # AI编程 # MCP服务

1年前

0100.7K

SadTalker：让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

综合介绍 SadTalker是一个开源工具，能够将单张静态人像照片和音频文件结合，创造出逼真的说话头像视频，适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术，如ExpNet和PoseVA...

最新AI资源 # AI开源项目 # AI数字人 # 口型同步

1年前

0100.6K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具，支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

2年前

0100.6K

Screenshot to Code：将截图转换为干净前端代码的AI工具

综合介绍 Screenshot-to-Code 是一个开源工具，利用人工智能将截图、设计稿和 Figma 设计转换为干净、功能性的代码。该工具支持多种前端技术栈，包括 HTML、Tailwind CS...

最新AI资源 # AI开源项目 # AI页面设计

2年前

0100.5K

Emigo：在Emacs中使用AI完成复杂编程任务的助手

综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手，由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型（LLM），帮助程序员在 Emacs 中完成代码分析...

最新AI资源 # AI开源项目 # AI编程

1年前

0100.5K

multi-model-bolt.new：基于 Bolt.new 的开源修改版，AI驱动的全栈开发工具

综合介绍 multi-model-bolt.new 是一个基于 Bolt.new 的修改版本，允许使用 TogetherAI 模型，支持部署、移动响应和语音输入等功能。用户可以直接在浏览器中提示、运行...

最新AI资源 # AI IDE # AI开源项目 # AI编程

2年前

0100.4K

MiMo：高效数学推理与代码生成的小型开源模型

综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目，专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型，包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...

最新AI资源 # AI开源项目

1年前

0100.4K

Zerox：PDF、DOCX、图像转换为Markdown，视觉模型高精度OCR

综合介绍 Zerox是一个开源项目，旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发，提供了简单高效的OCR（光学字符识别）解决方案。Ze...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

0100.3K

Fragments：类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

综合介绍 Fragments by E2B是一个开源项目，提供了一个基于Next.js的模板，用于构建完全由AI生成的应用程序。该项目由 E2B 开发，旨在简化和加速AI应用的开发过程。它集成了多种现...

最新AI资源 # AI开源项目 # AI编程

2年前

0100.3K

BlinkShot：输入提示词实时生成图像（免费接入Flux Schnell模型）

综合介绍 BlinkShot 是一个开源的实时AI图像生成器，利用Together AI和Flux Schnell技术，用户可以在输入提示的同时生成高质量的图像。该平台完全免费，支持用户自定义和二次开...

最新AI资源 # AI在线生成图像 # AI开源项目

2年前

0100.3K

MathTranslate：科学论文LaTeX翻译工具

综合介绍 MathTranslate 是一个专门用于翻译 LaTeX 文档的在线工具，特别适用于科学论文的翻译。该工具能够保持 LaTeX 表达式（如数学表达式）不变，并最终将 LaTeX 文档编译成...

最新AI资源 # AI开源项目 # AI翻译 # 论文

2年前

0100.3K

SemHash：快速实现语义文本去重，提升数据清理效率

综合介绍 SemHash 是一个轻量级且灵活的工具，用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN（近似最近邻）相似性搜索。SemHa...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

0100.2K

InstantIR：受损图像修复与图像高清放大开源项目，最低16G显存

综合介绍 InstantIR 是由 InstantX 团队开发的一款创新的单图像修复模型，旨在复活您损坏的图像，提供极高质量且逼真的细节，能够对受损图像进行高质量的修复。该工具不仅可以恢复图像的细节...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

0100.2K

KTransformers：大模型推理性能引擎：极致加速，灵活赋能

综合介绍 KTransformers：专为突破大模型推理瓶颈而生的高性能 Python 框架。它不仅仅是一个简单的模型运行工具，更是一套极致的性能优化引擎和灵活的接口赋能平台。 KTransf...

最新AI资源 # AI开源项目

1年前

0100.1K

Cua：让AI代理在macOS/Linux沙盒中安全执行应用

综合介绍 Cua 是一个开源项目，全称“Computer-Use Agent”（计算机使用代理），读作“koo-ah”。它专为 Apple Silicon 设备设计，能创建并运行高性能的 macOS ...

最新AI资源 # AI开源项目

1年前

0100K

微信Markdown编辑器：简洁高效的微信图文排版工具，一键粘贴文章到微信公众号

综合介绍微信 Markdown 编辑器（WeChat Markdown Editor）是一款高度简洁的微信图文排版工具，旨在帮助用户轻松创建美观的微信文章。该编辑器支持所有基础的 Markdown ...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

099.8K

TRELLIS：Microsoft开发的3D资产生成模型，支持多种格式和灵活编辑

综合介绍 TRELLIS是一个由Microsoft开发的大型3D资产生成模型。它能够接收文本或图像提示，并生成各种格式的高质量3D资产，如辐射场、3D高斯和网格。TRELLIS的核心是统一的结构化潜在...

最新AI资源 # AI开源项目 # AI文本与图片转3D

2年前

099.8K

NarratoAI：文本生成影视解说与自动化剪辑神器

综合介绍 NarratoAI 是一个集影视解说、自动化剪辑、配音和字幕生成于一体的全自动化工具。它依托大型语言模型（LLM）技术，自动生成文案，并自动剪辑视频，配上相应的配音和字幕，为用户提供一站式的...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI文本转视频

2年前

099.7K

Second Me：本地训练拥有个人记忆和习惯的AI分身

综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目，它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯，变成一个懂你的智...

最新AI资源 # AI开源项目 # AI生活效率助手 # 大模型微调

1年前

099.6K

免服务器生成永久微信群二维码

综合介绍 serverless-qrcode-hub 是一个开源工具，专为解决微信群聊二维码频繁失效的问题而设计。它基于 Cloudflare Workers 和 D1 数据库，无需传统服务器即可运行...

AI实操教程 # AI开源项目

1年前

099.5K

AutoGen：微软开发的多智能体对话框架

综合介绍 AutoGen是由微软研究团队开发的开源框架，专注于通过多智能体对话来简化大型语言模型（LLM）应用的构建。它允许开发者创建可以相互对话、协作解决任务的AI代理。这种方法不仅提高了LLM的性...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

099.4K

DCT-Net：照片和视频转绘为动漫风格化的开源工具

综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目，旨在实现图像的动漫风格化转换。该项目利用深度学习技术，通过域校准翻译（Domain-Calibrat...

最新AI资源 # AI图像风格控制 # AI开源项目 # AI视频转换风格

2年前

099.4K

Fay数字人框架：集成语言模型与3D数字角色，支持多种应用场景

综合介绍 Fay是一个开源的3D虚拟数字人框架，集成了语言模型和数字角色，适用于多种应用场景，如虚拟购物导购、虚拟主播、助理、服务员、教师以及基于语音或文本的移动助手。Fay框架支持全离线使用，提供毫...

最新AI资源 # AI开源项目 # AI数字人

2年前

099.2K

NSFW Detector：检测文件是否包含不适（NSFW）内容，保护数据安全

综合介绍 NSFW Detector 是一个基于 AI 的不适内容检测工具，主要用于检测图像、视频、PDF 文件等是否包含不适内容。该工具采用了 Falconsai/nsfwimagedetectio...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

099.1K

Local Deep Research：本地运行的生成深度研究报告工具

综合介绍 Local Deep Research 是一个开源的人工智能研究助手，旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行，使用户可以在不依赖云服务的情况下完成研究任务。工具...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

098.9K

YOLOE：实时视频检测和分割物体的开源工具

综合介绍 YOLOE 是清华大学软件学院多媒体智能组（THU-MIG）开发的一个开源项目，全称“You Only Look Once Eye”。它基于 PyTorch 框架，属于 YOLO 系列的扩展...

最新AI资源 # AI开源项目 # AI抠图改背景 # 视觉目标检测

1年前

098.8K

Vanna：利用RAG技术将文本生成精准SQL查询

综合介绍 Vanna是一个MIT许可的开源Python框架，专注于通过RAG（检索增强生成）技术生成SQL查询。用户可以通过训练RAG模型，将其应用于自己的数据，然后提出问题，Vanna会返回相应的S...

最新AI资源 # AI开源项目 # AI数据分析 # 知识检索与RAG框架

2年前

098.8K

TinyZero：低成本复现 DeepSeeK-R1 Zero 的顿悟效果

综合介绍 TinyZero 是一个基于 veRL 的强化学习模型，旨在复现 DeepSeeK-R1 Zero 在倒计时和乘法任务中的表现。令人惊讶的是，该项目仅需 30 美元的运行成本（使用 2xH2...

最新AI资源 # AI开源项目

2年前

098.7K

AnkiAIUtils：Anki闪卡学习AI工具集，自动优化记忆卡片的智能助手

综合介绍 AnkiAIUtils是一套专为Anki闪卡学习系统设计的人工智能增强工具集。该工具由一位医学院学生开发，旨在通过AI技术自动改进用户在学习过程中遇到困难的卡片。它能够智能地为用户提供个性化...

最新AI资源 # AI开源项目 # AI教育工具

2年前

098.7K

MoneyPrinterPlus：一键生成短视频的AI工具，免费批量混剪

综合介绍 MoneyPrinterPlus 是一个开源项目，旨在通过AI技术一键生成和混剪各类短视频，并自动发布到多个视频平台，如抖音、快手、小红书和视频号。该工具支持本地和云端语音模型，包括chat...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI视频生成工具

2年前

098.6K

DeOldify：使用AI技术为黑白照片和视频上色的经典开源工具

综合介绍 DeOldify 是一个基于深度学习技术的开源项目，专门用于为黑白照片和视频进行智能上色和修复。该项目采用创新的 NoGAN 训练方法，成功解决了传统 GAN 网络在图像上色过程中常见的瑕疵...

最新AI资源 # AI图像放大与修复 # AI图像风格控制 # AI开源项目

2年前

098.6K

Yutu：YouTube 命令行管理工具，接入AI全自动运营 YouTube 频道

综合介绍 Yutu 是一个功能强大的开源命令行工具，专为 YouTube 用户设计，托管于 GitHub，由 eat-pray-ai 团队开发。它通过终端操作实现对 YouTube 视频、播放列表、频...

最新AI资源 # AI开源项目

1年前

098.5K

AI RSS生成器：通过AI将网页内容转换为RSS订阅源的工具

综合介绍 AI RSS是一个创新的工具，通过AI技术将网页内容转换为RSS订阅源。它包含两个主要部分：一个浏览器插件和一个服务器端。浏览器插件允许用户选择网页中的列表并生成结构化数据描述（SDD）文件...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

098.5K

DiffSynth-Engine：低现存部署FLUX、Wan2.1的开源引擎

综合介绍 DiffSynth-Engine 是魔搭社区（ModelScope）推出的开源项目，托管于 GitHub。它基于扩散模型技术，专注于高效生成图像和视频，适合开发者在生产环境中部署 AI 模型...

最新AI资源 # AI开源项目

1年前

098.5K

WeChatAI：Windows版微信群聊智能助手客户端

综合介绍 WeChatAI 是一款基于 Python 开发的微信群聊和个人智能助手，支持多种大语言模型（如 DeepSeek、Gemini、通义千问），可以实现智能对话、自动回复等功能。该项目采用现代...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

098.4K

Anubis：通过工作量证明干扰AI爬虫抓取

综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具，主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明（Proof-of-Work）挑战...

最新AI资源 # AI开源项目

1年前

098.4K

Zola：支持文档上传与多模型的开源AI聊天Web应用

综合介绍 Zola 是一个免费且开源的 AI 聊天应用，由开发者 Julien Thibeaut（GitHub 用户名 ibelick）开发，托管在 GitHub 上。它最大的特点是支持多种 AI 模...

1年前

098.2K

Step-Audio：多模态语音交互框架，识别语音并使用克隆语音交流等功能

综合介绍 Step-Audio 是一个开源的智能语音交互框架，旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话（如中文、英文、日语）、情感语音（如快乐、悲伤）、区域方言（如粤语、四川...

最新AI资源 # AI开源项目 # AI语音克隆 # 多模态实时互动产品

1年前

098.2K

olmOCR：PDF文档转换为文本，支持表格、公式和手写内容的识别

综合介绍 olmOCR 是由 Allen Institute for Artificial Intelligence (AI2) 的 AllenNLP 团队开发的一款开源工具，专注于将 PDF 文件转...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

098.1K

MCP Containers：基于 Docker 提供数百种 MCP 容器化部署

综合介绍 MCP Containers 是一个开源项目，托管在 GitHub，专注于为 Model Context Protocol（MCP）服务器提供容器化解决方案。它通过 Docker 容器简化了...

最新AI资源 # AI开源项目 # MCP服务

1年前

098.1K

Muyan-TTS：个性化播客语音训练与合成

综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音（TTS）模型。它通过超过10万小时的播客音频数据预训练，支持零样本语音合成，生成高质量的自然语音。模型基于 Llama-3.2-3...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

098K

语析（Yuxi-Know）：基于知识图谱的智能问答平台

综合介绍 Yuxi-Know 是一个开源的智能问答平台，结合知识图谱和 RAG（检索增强生成）技术，帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱，使用 FastAPI 和 VueJS 构...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

1年前

098K

promptfoo：提供安全可靠的LLM应用测试工具

综合介绍 promptfoo 是一个开源的命令行工具和库，专门用于评估和红队测试大语言模型（LLM）应用。它为开发者提供了一套完整的工具，用于构建可靠的提示、模型和基于检索的生成（RAGs），并通过自...

最新AI资源 # AI开源项目

1年前

097.9K

Easy Dataset：创建大模型微调数据集的简易工具

综合介绍 Easy Dataset 是一个专门为大模型（LLM）微调设计的开源工具，托管在 GitHub 上。它提供了一个简单易用的界面，让用户可以上传文件、自动分割内容、生成问题和答案，最终输出适合...

最新AI资源 # AI开源项目 # 大模型微调

1年前

097.8K

Open R1：Hugging Face 复现 DeepSeek-R1 的训练过程

综合介绍 Hugging Face的Open R1项目是一个完全开源的DeepSeek-R1复现项目，旨在构建R1管道的缺失部分，使每个人都能复现并在其基础上进行构建。该项目设计简单，主要包括训练和评...

最新AI资源 # AI开源项目

2年前

097.8K

Comp AI：自动化SOC 2、ISO 27001和GDPR合规的开源平台

综合介绍 Comp AI 是一个开源平台，由 Comp AI, Inc. 开发，总部位于美国旧金山。它帮助企业通过自动化工具快速完成 SOC 2、ISO 27001 和 GDPR 等合规要求，目标是几...

最新AI资源 # AI开源项目 # 专业生产力工具

1年前

097.8K

Qwen2.5-Omni：多模态输入和实时语音交互的端测模型

综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入，并实时生成文本或自然语音响应。这款模型于 2025 年 3 ...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

097.8K

Chonkie：轻量级RAG文本切块库

综合介绍 Chonkie 是一个轻量级且高效的 RAG（Retrieval-Augmented Generation）文本切块库，旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法，包...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

097.6K

OmniSQL：将自然语言转化为高质量SQL查询的模型

综合介绍 OmniSQL 是一个开源项目，由 RUCKBReasoning 团队开发，托管在 GitHub 上。它的核心功能是将用户输入的自然语言问题转化为高质量的 SQL 查询语句，帮助用户轻松与数...

最新AI资源 # AI开源项目 # AI数据分析

1年前

097.6K

Neural4D：生成高分辨率3D建模数字资产的AI平台

综合介绍 Neural4D 是一个基于人工智能的创新平台，专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发，依托世界领先的端到端3D生成大模型技...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

097.6K

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式

综合介绍 CoAI.Dev (原 Chat Nio) 是一个集成多种AI模型的聊天平台，支持分布式流式传输、图像生成、跨设备对话同步及分享等功能。它实现了订阅和Token计费系统，Key中转服务以及多...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI本地化聊天应用

2年前

097.6K

Activepieces：AI工作流程自动化，适合非技术用户的任务编排工具，开源Zapier替代品

综合介绍 Activepieces是一个开源的全能型自动化工作流平台，专注于为企业和个人用户提供直观、强大的自动化解决方案。该平台采用TypeScript开发，具有极强的可扩展性，支持200多个集成服...

最新AI资源 # AI开源项目 # 低代码工作流

2年前

097.5K

k8m：简化Kubernetes集群管理的轻量级AI控制台工具

综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard，专为简化集群管理设计。它基于 AMIS 构建，并通过 kom 作为 Kubernetes API 客...

最新AI资源 # AI开源项目

2年前

097.5K

AI reads books：AI逐页阅读PDF书籍，自动提取知识要点并生成总结

综合介绍 AI-reads-books-page-by-page是一个基于Python开发的智能PDF书籍分析工具，它能够自动化地对PDF书籍进行逐页分析，提取关键知识点，并在指定页数间隔后生成阶段性...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

097.5K

Copilot后端代理服务：用其他模型接管GitHub Copilot插件服务端

综合介绍 Copilot后端代理服务是一个开源项目，旨在通过借助其他FIM模型（如DeepSeek）来管理GitHub Copilot插件服务端，同时支持多人共享官方账号。该服务支持多种IDE，包括V...

最新AI资源 # AI开放服务 # AI开源项目

2年前

097.5K

ChatFree（ChatAnywhere-2）：使用GPT API创建的本地Copilot，支持任意窗口中补全对话

综合介绍 ChatFree是一个开源项目，旨在让用户的AI应用摆脱浏览器的束缚，实现本地化运行。利用GPT API创建的Copilot，旨在支持多种办公软件如Office、Word、WPS等。该项目由...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

097.5K

99AI：集成多模态AI服务的商业化Web应用（免费开源）

综合介绍 99AI 是一个开源的 AI Web 应用项目，旨在提供一个易部署、低门槛的集成化人工智能服务平台。该项目支持智能对话、多模态模型、应用广场、联网搜索等功能，并集成了 AI 绘画、音乐和视频...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI本地化聊天应用

2年前

097.3K

Midjourney Proxy：代理/逆向Midjourney Discord频道，实现AI绘图API调用（免费测试）

综合介绍 Midjourney Proxy是一个开源项目，旨在为Midjourney的Discord频道提供代理服务，将AI绘图功能转换为API形式。该项目完全免费且开源，支持一键换脸、图片混合、图生...

最新AI资源 # AI开源项目

2年前

097.2K

YTSage：YouTube下载器，免费下载YouTube视频，提取音频，获取字幕

综合介绍 YTSage 是一个现代化的 YouTube 下载工具，具有简洁的 PyQt6 界面。用户可以使用 YTSage 下载任意质量的视频，提取音频，获取字幕（包括自动生成的字幕），并查看视频的元...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

097.2K

LangGraph CodeAct：生成代码帮助智能体解决复杂任务

综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架，基于 CodeAct 架构（详见论文 arXiv:2402.01030）。它通过生成...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

097K

NVIDIA Garak：检测LLM漏洞的开源工具，确保生成式AI的安全性

综合介绍 NVIDIA Garak 是一款开源工具，专门用于检测大型语言模型（LLM）的漏洞。它通过静态、动态和自适应探测，检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱...

最新AI资源 # AI开源项目 # 大模型微调

2年前

097K

ConsisID：一张人像参考图，生成人物一致的视频，多终端快速集成

综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目，旨在通过频率分解技术实现身份一致的文本到视频生成（IPT2V）。该项目的核心是一个基于DiT（Diffusion Transfor...

最新AI资源 # AI开源项目 # AI文本转视频

2年前

097K

CrisperWhisper：精确的逐字语音转录工具

综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具，专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳，甚至在语音填充和停顿的情况下也能准...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

096.8K

Fast GraphRAG：高准确率且低成本的图形化检索增强生成工具

综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具，旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成（RAG）。该工具能够智能适应用户的使...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

096.7K

Trackers：用于视频对象跟踪的开源工具库

综合介绍 Trackers 是一个开源的 Python 工具库，专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法，如 SORT 和 DeepSORT，允许用户结合不同的对象检测模型（如 YOLO...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

096.7K

ChatTTS：模仿真人说话声音的语音生成模型（ChatTTS一键加速包）

综合介绍 ChatTTS 是一个专为对话场景设计的生成语音模型。它能够生成自然且富有表现力的语音，支持多种语言和多位说话者，适用于互动对话。该模型通过预测和控制细粒度的韵律特征，如笑声、停顿和插话，超...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

096.7K

LlamaEdge：本地运行和微调LLM的最快捷方式

综合介绍 LlamaEdge是一个开源项目，旨在简化本地或边缘设备上运行和微调大型语言模型（LLM）的过程。该项目支持Llama2系列模型，并提供与OpenAI兼容的API服务，使用户能够轻松创建和运...

最新AI资源 # AI开源项目 # 大模型微调

2年前

096.6K

GraphRAG Visualizer：可视化和探索Microsoft GraphRAG工件的工具

综合介绍 GraphRAG Visualizer 是一个基于网页的工具，旨在帮助用户可视化和探索来自 Microsoft GraphRAG 的工件。通过上传由 GraphRAG 索引管道生成的 Par...

最新AI资源 # AI开源项目 # 知识图谱

2年前

096.6K

FlowDown（浮望）：iOS/macOS下体验流畅的AI客户端

综合介绍 FlowDown-App 是一个轻量、高效的 AI 对话客户端，由开发者团队使用 Swift 和 UIKit 开发，旨在为用户提供快速、顺畅的智能对话体验。该应用分为标准版（FlowDown...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

096.5K

Melty：体验AI驱动的代码编辑器，让每一次对话都成为Git提交

综合介绍 Melty是一款革命性的AI代码编辑器，它将聊天对话与Git版本控制完美结合。由来自Replicate的Charlie和Jackson共同开发，这款工具旨在解决传统AI编码工具的痛点。其最大...

最新AI资源 # AI开源项目 # AI编程

2年前

096.5K

Amurex：开源AI会议记录助手，自动记录会议内容生成总结

综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手，旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容，并自动发送跟...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

096.4K

CogAgent：智谱开源的智能视觉语言模型，实现图形界面自动化操作

综合介绍 CogAgent是由清华大学数据挖掘研究组（THUDM）开发的开源视觉语言模型，旨在实现跨平台的图形用户界面（GUI）自动化操作。该模型基于CogVLM（GLM-4V-9B），支持中英文双语...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

096.4K

Sana：快速生成高分辨率图像，0.6B超小尺寸模型，低配笔记本GPU运行

综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架，能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术，显著...

最新AI资源 # AI开源项目 # AI自部署图像生成工具

2年前

096.3K

LogoCreator：开源Logo生成器，使用AI智能生成专业品牌Logo

综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器，专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源，在Git...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

096.3K

Open Canvas：代码编辑协作画布，开源版OpenAI Canvas/Claude Artifacts

综合介绍 LangChain推出的Open Canvas 是一个开源的网络应用程序，旨在通过内置的双代理记忆功能来提升文档编辑和协作体验，并且集成smith可以观察完整的执行细节。该平台受 OpenA...

最新AI资源 # AI写作 # AI开源项目 # AI画布

1年前

096.3K

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

综合介绍 Ultravox是一个创新的多模态大语言模型（LLM），专为实时语音处理而设计。与传统的语音识别系统不同，Ultravox无需单独的音频语音识别（ASR）阶段，能够直接将音频转换为高维空间中...

最新AI资源 # AI大模型原生对话工具 # AI开源项目

2年前

096.2K

One Hub：管理和分发OpenAI接口，支持多种模型和统计功能

综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发，旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...

最新AI资源 # AI开源项目

2年前

096.1K

AI ContentCraft：生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

综合介绍 AI ContentCraft 是一个多功能的内容创作工具，集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换，能够批...

最新AI资源 # AI写作 # AI开源项目

2年前

096K

腾讯混元3D（Hunyuan3D）：生成高分辨率3D资产，多种3D素材生成工作流

综合介绍腾讯混元3D（Hunyuan3D 2.0）是腾讯推出的先进大规模3D合成系统，旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件：大规模形状生成模型Hunyuan3D-DiT和大规模纹理...

最新AI资源 # AI开源项目 # AI文本与图片转3D

2年前

095.9K

AiPy：自动化运行Python代码完成数据分析任务

综合介绍 AiPy 是一个开源的 Python 命令行工具，由 Knownsec 团队开发。它结合大语言模型（LLM）和 Python 运行环境，让用户通过自然语言描述任务，自动生成并运行 Pytho...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

095.7K

Baichuan-Audio：支持实时语音交互的端到端音频模型

综合介绍 Baichuan-Audio 是由百川智能（baichuan-inc）开发的一个开源项目，托管于 GitHub 上，专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架，能够将语音...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

095.5K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

综合介绍 Datalab 提供了一系列先进的AI模型，专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越，而且易于使用，并且是开源的。平台上的Marker模型可以快速准确地将...

最新AI资源 # AI开放服务 # AI开源项目 # OCR

2年前

095.5K

Austen：分析书籍角色关系并生成图表的AI工具

综合介绍 Austen 是一个开源的 AI 工具，它使用 Angular 框架和 Analogjs 初始化，结合 Mermaidjs 技术生成图表，帮助用户分析书籍中的角色关系。用户可以输入 Open...

最新AI资源 # AI开源项目 # AI白板与信息图

1年前

095.4K

code2prompt：将代码库转换为大模型可理解的prompt文件

综合介绍 code2prompt 是一个开源的命令行工具，由开发者 Mufeed VH 创建并托管在 GitHub 上，旨在帮助用户将整个代码库快速转换为适合大语言模型（LLM）的提示（prompt...

最新AI资源 # AI开源项目

1年前

095.3K

Zed：Rust开发的高性能多人协作代码编辑器

综合介绍 Zed 是由 Atom 和 Tree-sitter 的创造者开发的一款高性能、多用户协作的代码编辑器。Zed 采用 Rust 语言编写，旨在提供快速、流畅的编码体验。其主要特点包括支持多人实...

最新AI资源 # AI IDE # AI开源项目 # AI编程

2年前

095.3K

Moshi：实时语音对话框架，支持多种语言和口音的语音对话基础模型

综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听，还能进行自然对话，支持多模态交互，包括看、听、说的能力。Moshi Ch...

最新AI资源 # AI开源项目

2年前

095.2K

Dify-Plus：为Dify开发的企业内部管理后台

综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上，新增了基于的管理中心，针对企业场景进行了功能优化。项目最初为企业内部使用，后来发现社区有类似需求，便...

最新AI资源 # AI开源项目

1年前

095.2K

加载更多