AI开源项目

共 1020 篇文章

排序

浏览收藏

ACE++：用文本指令精准对图像局部编辑的多功能开源工具

综合介绍 ACE++ 是由阿里巴巴通义实验室（Tongyi Lab）的 ali-vilab 团队开发的一个开源项目。它基于 FLUX.1-Fill-dev 模型，旨在通过简单的文字指令实现图像生成和编...

1年前

090.2K

Open Deep Research：LangChain开源的深度研究智能助手

综合介绍 Open Deep Research 是一个基于网络的研究助手，能够生成有关任何主题的综合研究报告。该系统采用计划和执行的工作流程，用户可以先对报告结构进行规划并审阅，然后进入耗时的研究阶段...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

090K

TableGPT Agent：专为分析复杂表格数据设计的智能工具

综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具，专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型，利用自然语言交互的方式，让用户能够轻松查询、操...

最新AI资源 # AI开源项目 # AI数据分析

1年前

090K

CoolCline：又一个增强版Cline智能编码助手，结合ClineRoo Cline和Bao Cline的优点

综合介绍 CoolCline 是一个强大的编码助手，结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面（CLI）和编辑器协同工作，为您带来最强大...

最新AI资源 # AI开源项目 # AI编程

2年前

089.9K

UNO：支持单主体和多主体定制化图像生成工具（适合电商配图）

综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型，专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...

最新AI资源 # AI开源项目

1年前

089.8K

MoBA: Kimi 推出的支持长上下文处理的大语言模型

综合介绍 MoBA（Mixture of Block Attention）是由MoonshotAI开发的一种创新注意力机制，专为长上下文处理的大语言模型（LLMs）设计。MoBA通过将全上下文划分为多...

最新AI资源 # AI开源项目

1年前

089.8K

EditorJumper：Cursor/Trae/Windsurf和JetBrains无缝切换工具

综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件，由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE（如 IntelliJ ...

最新AI资源 # AI开源项目

1年前

089.8K

NV Ingest：解析复杂格式文档，提取多模态数据为元数据和文本

综合介绍 NV Ingest（NVIDIA Ingest）是一套早期访问的微服务，专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本，以便嵌入到检索...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

089.7K

mcp-ui：基于MCP协议的简洁AI聊天界面

综合介绍 mcp-ui 是一个开源项目，由开发者 machaojin1917939763 创建，基于 Model Context Protocol（MCP）协议打造，是一款支持 Web 和桌面环境的智...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

089.7K

Infinity：生成高分辨率图像的比特自回归建模，实现无限制高分辨率图像生成

综合介绍 Infinity是一个开创性的高分辨率图像生成框架，由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法，突破了传统图像生成模型的限制。Infinity的核心特...

最新AI资源 # AI在线生成图像 # AI开源项目

2年前

089.7K

R1 Overthinker：强制 DeepSeek R1 模型延长思考时间

综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程，该工具能够使模型进行更深入的思考，从而提高其回答的质...

最新AI资源 # AI开源项目

2年前

089.7K

STAR：空间时序增强AI模型，提升视频分辨率清晰度

综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

089.7K

Flashcard：基于Dify构建的单词闪卡外语学习工具，替代多邻国（Duolingo）

综合介绍 Flashcard是一个开源的语言学习工具，旨在提供一个替代Duolingo的解决方案。该项目由Steven Lynn（GitHub用户名：stvlynn）开发，采用现代化的用户界面和多语言...

最新AI资源 # AI开源项目 # AI教育工具

1年前

089.6K

Coding Agent：基于Langgraph构建的简单编程助手

综合介绍 Coding Agent 是一个由 AbhinavTheDev 开发的智能编程助手，旨在帮助开发者提高编程效率。该工具利用人工智能技术，能够自动生成代码、提供编程建议，并协助开发者完成各种编...

最新AI资源 # AI开源项目 # AI编程

2年前

089.6K

Llama Tutor：提供个性化辅导的AI工具，基于 Llama 3.1 构建的开源 AI 个人助教项目

综合介绍 Llama Tutor 是一个基于 Llama 3.1 构建的开源 AI 个人助教项目，旨在为用户提供个性化的学习体验。通过整合多种技术栈，如 Together AI、Next.js 和 T...

最新AI资源 # AI开源项目 # AI教育工具

2年前

089.5K

opensource_notebooklm：基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

综合介绍开源NotebookLM是一个创新的人工智能项目，它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术，旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

089.5K

WebPilot：智能网页信息处理工具，网页内容抓取免费API

WebPilot 综合介绍 Webpilot是一个免费开源的“网页助手”，它可以让你和任何网页进行自由交流，或者执行自动任务。你不需要切换网页或者复制粘贴，只需要选择文本或者输入指令，webpilot...

最新AI资源 # AI开放服务 # AI开源项目 # AI搜索工具

2年前

089.5K

Taipy：为数据科学家打造的高效数据分析与AI应用开源Python库

综合介绍 Taipy 是由 Avaiga 开发的一个强大的 Python 库，专为数据科学家和机器学习工程师设计，用于快速构建和部署数据驱动的 Web 应用程序。Taipy 提供了一整套工具和组件，使...

最新AI资源 # AI开源项目 # AI数据分析

2年前

089.4K

Diffusers Image Outpaint：超强开源AI图像扩展工具，图像外绘（image outpainting）

综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术，可以将图像进...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

089.4K

Omni-RGPT：图像和视频区域级理解多模态大模型，提升视觉内容分析能力

综合介绍 Omni-RGPT 是一个多模态大语言模型，旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术，Omni-RGPT 能够在视觉特征空间内高亮目标区域，并通过区域提示（如框或...

最新AI资源 # AI开源项目

2年前

089.3K

SuperCoder：命令行终端运行的智能代码助手

综合介绍 SuperCoder 是一个在终端运行的智能工具，专为程序员设计。它利用 AI 技术，帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源，支...

最新AI资源 # AI开源项目 # AI编程

1年前

089.3K

Gemini Playground：无服务器部署Gemini多模态对话网站

综合介绍 Gemini Playground 是一个开源项目，旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发，支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...

最新AI资源 # AI开源项目 # 免费大模型API

1年前

089.3K

Auto-Deep-Research：多Agent协作执行文献查询并生成研究报告

综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室（HKUDS）开发的一款开源AI工具，旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造，支持多种大语言模...

最新AI资源 # AI开源项目 # 生成深度研究报告 # 论文

1年前

089.3K

Awesome AI Agents：收集150+AI智能体框架的资源集合

综合介绍 Awesome AI Agents 是一个由 e2b-dev 团队维护的 GitHub 开源项目，专注于收集和整理与自主 AI 智能体相关的资源。这个项目汇集了超过 150 种 AI 智能体...

最新AI资源 # AI开源项目

1年前

089.3K

AIHawk：智能求职助手，自动化投放简历（限英文）

综合介绍 Auto_Jobs_Applier_AIHawk 是一款利用人工智能技术自动化求职的工具。它能够帮助用户在短时间内自动投递大量简历，并根据用户的个人信息和求职意向进行个性化调整。该工具旨在提...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

089.3K

sensitive-word：敏感词过滤工具，高效DFA算法实现

综合介绍敏感词过滤工具（Sensitive Word）是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词，支持多种格式转换和自定义替换策略。其设计目标是提供...

最新AI资源 # AI开源项目

2年前

089.3K

Sketch-Gen：生成高质量线稿和草图，反推图像提示词，一键安装包

综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具，旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来，利用先进的机器学习模型，能...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

089.3K

HivisionIDPhotos：开源智能AI证件照制作工具

综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具，能够智能识别用户拍照场景并进行抠图，生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸，未来还将推出美颜和...

最新AI资源 # AI开源项目 # AI抠图改背景

2年前

089.3K

Free-Search：免费获取实时谷歌搜索结果的API工具

综合介绍 Free-Search 是一个由 Hanzla Javaid 开发的开源 API 工具，托管在 GitHub 上。它的主要功能是通过自定义搜索引擎提供实时的谷歌搜索结果，并爬取网页内容返回结...

最新AI资源 # AI开源项目

1年前

089.2K

ColorFlow：漫画着色，黑白图像自动着色，提升图像色彩一致性和质量

综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具，旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道，通过参考图像池准确生成各种元素的颜色，包括角色的头发颜色和服...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

089.1K

Basic Memory：从AI对话中构建持久知识图谱的MCP服务

综合介绍 Basic Memory 是一个通过与AI助手（如Claude）对话来构建知识图谱的工具。它由 Basic Machines 公司开发，核心特点是把对话内容保存为 Markdown 文件，存...

最新AI资源 # AI开源项目 # MCP服务 # 知识图谱

1年前

089.1K

Onlook：面向前端设计开源Cursor，在React应用中设计并发布代码

综合介绍 Onlook是一款开源的设计工具，专为设计师和开发者打造，允许用户直接在运行的React应用中进行设计，并将设计修改转换为代码。该工具提供了一种直观的视觉编辑体验，类似于Figma或Webf...

最新AI资源 # AI开源项目 # AI页面设计

2年前

089.1K

CogVLM2：开源多模态模型，支持视频理解与多轮对话

综合介绍 CogVLM2 是由清华大学数据挖掘研究组（THUDM）开发的开源多模态模型，基于 Llama3-8B 架构，旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

089K

BrushEdit：腾讯ARC发布的图像修复和编辑的全能工具

综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术，能够自动识别和修复图像中的缺陷，同时支持用户进行交互式编辑。BrushEdit 结合了多种...

最新AI资源 # AI图像编辑 # AI开源项目

2年前

089K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

综合介绍 PengChengStarling（鹏城实验室）是一个多语言自动语音识别（ASR）工具，能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发，提供了完整的语音识别流程...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

089K

Easegen：开源数字人课程制作平台，PPT一键生成克隆数字人讲解视频

综合介绍 Easegen 是一个开源的数字人课程制作平台，旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案，用户可以创建数字人讲解的视频课程...

最新AI资源 # AI开源项目 # AI教育工具 # AI文本转视频

2年前

089K

UniAPI：免服务器统一管理大模型API转发

综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器，核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API，比如 OpenAI、Azure OpenAI、Clau...

最新AI资源 # AI开源项目

1年前

089K

Deep Recall：为大模型提供企业级记忆框架的开源工具

综合介绍 Deep Recall 是一个开源的企业级记忆框架，专为大型语言模型（LLM）设计。它通过高效的上下文检索和整合，提供超个性化的响应能力。框架采用三层架构，包括记忆服务、推理服务和协调器，支...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

088.9K

MagicArticulate：将静态3D模型生成骨骼结构动画资产

综合介绍 MagicArticulate 是一个由字节跳动与南洋理工大学合作开发的AI框架，专注于将静态3D模型快速转化为支持动画的数字资产。它通过先进的自回归Transformer和功能扩散模型，自...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

088.8K

Maestro：简化主流开源视觉语言模型微调过程的工具

综合介绍 Maestro 是由 Roboflow 开发的一款工具，旨在简化和加速多模态模型的微调过程，让人人都可以训练自己的视觉大模型。它提供了现成的配方，用于微调流行的视觉语言模型（VLM），如 F...

最新AI资源 # AI开源项目 # 大模型微调

1年前

088.8K

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架，可以实现任意说话人之间的语音转换，包括歌曲的翻唱和实时的变声。它具有低...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

088.8K

OpenAI Agents SDK：搭建多智能体协作工作流的Python框架

综合介绍 OpenAI Agents SDK 是 OpenAI 推出的一款轻量级开发工具，专为构建多智能体工作流设计。它基于 Python，简单易上手，支持开发者通过配置智能体（Agents）、任务切...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

088.8K

RolmOCR：识别手写和倾斜字符的文档OCR模型

综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别（OCR）工具，基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字，速度比同类工具...

最新AI资源 # AI开源项目 # OCR

1年前

088.7K

UltraRAG：一站式RAG系统解决方案，简化数据构建与模型微调

综合介绍 UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG（检索增强生成）系统解决方案。该框架基于敏捷部署和模块化构建...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

088.7K

Quadratic：集成AI对话和代码执行的在线数据分析表格

综合介绍 Quadratic 是一个开源的智能电子表格工具，结合了AI、代码和数据连接功能，旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言，Quadratic...

最新AI资源 # AI开源项目 # AI数据分析

1年前

088.7K

StarVector：从图像和文字生成SVG矢量图的基础模型

综合介绍 StarVector 是一个开源项目，它由 Juan A. Rodriguez 等开发者创建，目的是将图像和文字转化为可缩放矢量图形（SVG）。这个工具使用视觉语言模型，能够理解图像内容和文...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

088.7K

Klavis AI：面向AI应用的模型上下文协议（MCP）集成工具

综合介绍 Klavis AI 是一个开源平台，专注于简化模型上下文协议（MCP）的使用和集成。MCP 是一种开放标准，允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...

最新AI资源 # AI开源项目 # MCP服务

1年前

088.7K

Proxy Lite：3B参数视觉模型驱动的网页自动化工具

综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具，作为 Proxy 的迷你版，采用开放权重设计。它基于 3B参数的视觉语言模型（VLM），能够自...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

088.6K

AIBot PRO：集成多种AI产品的商业化聚合平台

综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端，旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话，集成了ChatGPT、Gemini、Claude、文心一言...

1年前

088.6K

OpenManus-RL：微调大模型强化智能体推理与决策能力

综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目，托管于GitHub。该项目通过强化学习（RL）技术提升大型语言模型（LLM...

最新AI资源 # AI开源项目 # 大模型微调

1年前

088.6K

AnimeGamer：用语言指令生成动漫视频和角色互动的开源工具

综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令，比如“宗介开紫色车兜风”，生成动漫视频，还能让不同动漫角色互动，比如《魔女宅急便》的琪琪和《天空之城...

最新AI资源 # AI开源项目 # AI视频生成工具 # AI视频转换风格

1年前

088.5K

BuffGPT：企业级生成式AI应用低代码开发平台

综合介绍 BuffGPT 是一个基于大语言模型（LLM）的开源AI应用开发平台，提供数据处理、模型调用、RAG检索和可视化工作流编排等开箱即用功能，帮助用户轻松构建和运营生成式AI应用。平台支持私有化...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

1年前

088.5K

AIaW：全功能、轻量级、可拓展插件的跨平台AI客户端

综合介绍 AIaW（AI as Workspace）是一个新一代的AI客户端，旨在提供全功能、轻量级且可拓展的解决方案。该平台支持多种服务商，包括OpenAI、Anthropic和Google等，能够...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

088.4K

AI no jimaku gumi：借助AI实现视频多语言字幕自动生成和翻译

综合介绍 AI no jimaku gumi（AI の字幕組）是一个强大的命令行视频字幕处理工具，专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术，包括 Whisper 语音...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

2年前

088.4K

OpenChat：快速集成多数据源的自定义聊天机器人

综合介绍 OpenChat 是一个用户友好的聊天机器人控制台，旨在简化大语言模型（LLMs）的使用。通过提供两步设置流程，OpenChat 使用户能够轻松创建和管理多个自定义聊天机器人。该平台支持 G...

最新AI资源 # AI客服机器人 # AI开源项目

2年前

088.4K

DiffBIR：提升图像质量的智能修复工具

综合介绍 DiffBIR（Blind Image Restoration with Generative Diffusion Prior）是一个由XPixelGroup开发的图像修复工具，旨在通过生成...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

088.4K

xyks：小猿口算逆向笔记,逆向工程与解密算法

综合介绍小猿口算逆向笔记是一个开源项目，旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明，如Frida、dexdump等，帮助用户了解和破解小猿口算的加...

最新AI资源 # AI开源项目 # AI教育工具

2年前

088.3K

FoleyCrafter：为无声视频添加生动同步的音效

综合介绍 FoleyCrafter 是一个由 OpenMMLab 开发的开源项目，旨在为无声视频生成生动且同步的音效。该项目利用先进的人工智能技术，通过分析视频内容，生成与之语义相关且时间同步的音效...

最新AI资源 # AI开源项目 # AI音乐

2年前

088.2K

Srcbook：开源快速构建和迭代完整TypeScript项目的全栈AI工程师

综合介绍 Srcbook是一个以TypeScript为核心的应用开发平台，旨在通过AI助手快速创建和迭代Web应用。它支持本地运行，提供交互式笔记本界面，允许用户编写和执行后端代码。Srcbook是开...

最新AI资源 # AI开源项目 # AI编程

2年前

088.2K

AppAgent：利用多模态智能体自动操作智能手机

综合介绍 AppAgent 是一个基于大语言模型（LLM）的多模态代理框架，旨在操作智能手机应用程序。该框架通过简化的操作空间，模仿人类的交互方式，如点击和滑动，从而无需系统后端访问，扩大了其在不同应...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

088.2K

GPT-Crawler：自动爬取网站内容生成知识库文件

综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具，托管在 GitHub 上。它通过输入一个或多个网站 URL，爬取页面内容，生成结构化的知识文件（output.jso...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

088.2K

ScrapeGraphAI：一个提示词搞定网页抓取，无需编写规则智能网页内容提取工具

综合介绍 ScrapeGraphAI是一个创新的Python网页抓取库，它巧妙地结合了大语言模型(LLM)和直接图逻辑来创建网站和本地文档的抓取管道。这个工具的独特之处在于它的简单性和强大功能的完美平...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

088.2K

XRAG：优化检索增强生成系统的可视化评估工具

综合介绍 XRAG（eXamining the Core）是一个专为评估高级检索增强生成（RAG）系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块，XRAG提供了不同配置和组件如何影响RAG...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

088.1K

DeepRant：实时翻译游戏聊天内容的开源客户端

综合介绍 DeepRant 是一款专为游戏玩家打造的开源翻译工具，旨在解决国际服务器中语言不通的问题。它通过快捷键实现游戏内文字的即时翻译，支持多种语言互译，让玩家无需退出游戏即可快速理解和回复聊天信...

最新AI资源 # AI开源项目 # AI翻译

1年前

088.1K

MiniRAG：简化检索增强生成框架，实体图索引召回相关文本块

综合介绍 MiniRAG是一个极其简单的检索增强生成（RAG）框架，旨在通过异构图索引和轻量级拓扑增强检索，使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室（HKUDS）开发，主要解决...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

088.1K

VideoSeal：先进的开源视频隐藏水印嵌入与提取工具，保护视频版权

综合介绍 VideoSeal是由Facebook Research开发的开源视频水印工具，旨在提供高效的视频水印嵌入与提取功能。该工具支持最新的开源模型，包含预训练模型、训练代码、推理代码和评估工具...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

088K

Plandex：支持超长上下文的开源AI编码助手

综合介绍 Plandex 是一个开源的终端 AI 编码助手，专为大型复杂软件项目设计。它能规划和执行多步骤任务，处理高达 200 万 token 的上下文，支持 30 多种编程语言。Plandex 提...

最新AI资源 # AI开源项目 # AI编程

1年前

087.9K

Yek：读取git仓库文本文件并快速分块，以供大模型使用

综合介绍 Yek 是一个基于 Rust 的快速工具，用于读取存储库或目录中的文本文件，将其分块并序列化以供大型语言模型（LLM）使用。该工具默认使用 .gitignore 规则跳过不需要的文件，并利用...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

087.9K

AutoMouser：生成浏览器自动化代码，将鼠标操作通过AI转为Selenium Python脚本

综合介绍 AutoMouser 是一个 Chrome 扩展程序，能够智能地跟踪用户交互，并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

087.9K

simple-one-api：一键集成多种免费大模型API，统一对外提供 OpenAI 接口

综合介绍 simple-one-api 是一个开源项目，旨在简化多种大模型API的集成。它支持千帆大模型平台、讯飞星火大模型、腾讯混元以及 MiniMax 和 Deep-Seek 等兼容 OpenAI...

最新AI资源 # AI开源项目

2年前

087.9K

Hibiki：实时语音翻译模型，保留原声特点的流式翻译

综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同，Hibiki 能够在用户讲话的同时，实时生成目标语言的自然语音翻译，并提供文本翻译。该模...

最新AI资源 # AI开源项目 # AI翻译

1年前

087.9K

DocAgent：自动生成Python代码文档的智能工具

综合介绍 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析，自动为 Python 代码库生成高质量、上下文感知的文档注释（d...

最新AI资源 # AI开源项目

1年前

087.9K

Clevrr Computer：使用 PyAutoGUI 库实现自动化桌面操作智能体

综合介绍 Clevrr Computer 是一个开源项目，旨在通过使用 PyAutoGUI 库来实现系统操作的自动化。该项目受到 Anthropic 的启发，设计了一个自动化代理，可以精确高效地执行用...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

087.8K

YuE：将歌词转化为完整歌曲的基础模型，支持多种音乐风格

综合介绍 YuE是一个开源的全歌曲生成基础模型，专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同，YuE能够生成包含主唱和伴奏的完整歌曲，时长可达数分钟。该模型解决了音乐生成中的...

最新AI资源 # AI开源项目 # AI音乐

2年前

087.7K

pdf2htmlEX：PDF无损转换为HTML，保持文本格式，适用于学术论文和杂志排版

综合介绍 pdf2htmlEX 是一个开源工具，旨在将 PDF 文件转换为 HTML 格式，通过分析 PDF 文件的内容并使用 HTML + CSS 精确还原其视觉效果, 将 PDF 文档转换为浏览器...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

087.6K

ExtractThinker：提取和分类文档为结构化数据，优化文档处理流程

综合介绍 ExtractThinker 是一个灵活的文档智能工具，利用大型语言模型（LLMs）从文档中提取和分类结构化数据，提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器，包括 Tess...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

087.6K

NextChat：兼容多平台的本地化AI聊天助手

综合介绍 NextChat是一项革命性的AI聊天服务，允许用户部署与GPT-3、GPT-4、GPT-4.5和Gemini Pro等一流语言模型的聊天服务。它提供了优雅的用户界面、协作特性、集成、模板和...

最新AI资源 # AI开放服务 # AI开源项目 # AI本地化聊天应用

1年前

087.6K

Vision Agent：解决多种视觉目标检测任务的视觉智能体

综合介绍 Vision Agent 是由 LandingAI（吴恩达团队）开发的一个开源项目，托管在 GitHub 上，旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

087.5K

AIEditor：创建AI驱动的富文本编辑器，支持多种前端框架

综合介绍 AIEditor 是一个由 AI 驱动的下一代富文本编辑器，基于 Web Component 开发，支持 Vue、React、Angular 等几乎所有主流前端框架。它兼容 PC Web 和...

最新AI资源 # AI写作 # AI开源项目

2年前

087.5K

Docs：开源的协作笔记和文档管理工具

综合介绍 Docs 是一个开源的协作笔记和文档管理平台，由 suitenumerique 团队开发。它使用 Django 和 React 技术构建，目标是提供一个简单易用的工具，帮助用户记录笔记、管理...

最新AI资源 # AI开源项目 # AI笔记

1年前

087.5K

VideoMind：视频按时间戳定位内容与问答的开源项目

综合介绍 VideoMind 是一个开源的多模态AI工具，专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔（Ye Liu）和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...

1年前

087.5K

Devin.cursorrules：增强Cursor IDE开发体验，将Cursor/Windsurf打造成类Devin智能编程助手

综合介绍 Devin.cursorrules 是一个创新的开源项目，旨在将价格实惠的Cursor或Windsurf IDE（约20美元）转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...

最新AI资源 # AI开源项目 # AI编程

2年前

087.5K

RAG Web UI：构建智能文档问答系统，简单构建私有Web端知识库

综合介绍 RAG Web UI 是一个基于 RAG（检索增强生成）技术的智能对话系统。它帮助企业和个人构建基于自身知识库的智能问答系统。通过结合文档检索和大语言模型，RAG Web UI 提供准确可靠...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

087.4K

MMAudio：为视频画面生成同步音效与配乐，视频到音频的多模态联合训练工具

综合介绍 MMAudio是一个开源项目，旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基（Ho Kei Cheng）等人开发，主要功能是根据视频和/或文本输入生成同步音频。MM...

最新AI资源 # AI开源项目 # AI音乐

2年前

087.4K

Maxun：开源无代码平台，自动抓取网页数据并转换为API或电子表格

综合介绍 Maxun是一个开源的无代码网页数据提取平台，用户可以在几分钟内训练机器人，自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动，能够适应网站布局的变化，提供强大的数据抓取功能...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

087.4K

Micro Agent：AI编程智能体，自动生成代码并测试、修复代码

综合介绍 Micro-Agent是由Builder.io开发的一款开源AI编码助手，旨在为开发者提供自动生成和测试代码的功能。它通过理解自然语言描述生成测试用例，并迭代代码直到所有测试通过，从而减少开...

最新AI资源 # AI开源项目 # AI编程

2年前

087.4K

Awesome LLM Apps：收集和探索优秀开源的LLM应用程序，一行命令快速部署

综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库，专门收集和展示各种优秀的LLM（大语言模型）应用程序。该仓库包含了使用 OpenAI、An...

最新AI资源 # AI开源项目

2年前

087.4K

Cosmos：世界基础模型，构建物理世界的人工智能基础模型平台

综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台，专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型，包括基于扩散和自回归的世界...

最新AI资源 # AI开放服务 # AI开源项目

2年前

087.4K

DH live：在30/40系显卡流畅实时交互的AI数字人

综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目，旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡，能够以 25+ fps 的速度实时运行。用户可...

最新AI资源 # AI开源项目 # AI数字人

2年前

087.4K

Agenta：集成到AI应用的提示词与模型效果评估工具

综合介绍 Agenta 是一个开源的AI模型管理工具，专门帮助用户轻松实验提示词、测试模型效果和监控运行情况。它适合想快速开发AI应用的人，提供了一个简单操作的平台。你可以用它试试不同提示词的效果，对...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

087.3K

Aggregator：一站式代理爬取与聚合平台，免费代理池（请合规使用）

综合介绍 Aggregator 是一个开源项目，旨在打造一个免费代理池，能够爬取各种可用的代理节点。该平台具有灵活的插件系统，用户可以根据目标网站的特殊需求，通过插件实现特定功能。项目主要用于学习爬虫...

最新AI资源 # AI开源项目

2年前

087.2K

llm.pdf：在PDF文件中运行大型语言模型的实验项目

综合介绍 llm.pdf 是一个开源项目，允许用户在 PDF 文件中直接运行大型语言模型（LLM）。这个项目由 EvanZhouDev 开发，托管在 GitHub 上，展示了一种创新的方法：通过 Em...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

1年前

087.2K

SkyPilot：在任何云端高效运行AI与批处理任务的开源框架

综合介绍 SkyPilot 是一个由加州伯克利大学 Sky Computing Lab 发起的开源框架，旨在帮助用户在任何云端基础设施上高效运行 AI 和批处理任务。它支持超过 14 种云服务（包括 ...

最新AI资源 # AI开源项目

1年前

087.2K

KBLaM：为大模型嵌入外部知识的开源增强工具

综合介绍 KBLaM 是微软开发的一个开源项目，全称是“Knowledge Base augmented Language Model”（知识库增强语言模型）。它通过将外部知识转化为向量并嵌入大模型的...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

087.2K

TangoFlux：快速文本到配音转换工具，3秒钟生成30秒长音频

综合介绍 TangoFlux 是一个由 DeCLaRe Lab 开发的高效文本到音频（TTA）生成模型。该模型能够在短短 3.7 秒内生成长达 30 秒的 44.1kHz 立体声音频。TangoFlu...

最新AI资源 # AI开源项目 # AI音乐

2年前

087.2K

Genspark2api（失效）

综合介绍 genspark2api 是一个开源的 API 服务工具，托管在 GitHub 上，由开发者 deanxv 创建。它提供了一个支持多模型对话、文生图和文生视频的接口服务，用户可以通过 Doc...

最新AI资源 # AI开源项目 # 免费大模型API

1年前

087.2K

Novel：模仿Notion AI的开源写作编辑器

综合介绍这是一个由Steven Tey开发的开源项目，名为Novel，它是一个Notion风格的所见即所得文本编辑器，集成了AI自动补全功能，可助力用户提升文字输入效率。项目提供了详尽的文档和安装指...

最新AI资源 # AI写作 # AI开源项目

2年前

087.2K

Story-Adapter：根据长篇故事生成连续且风格一致的图像插画

综合介绍 Story-Adapter 是一个创新的故事可视化框架，它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发，采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

087.1K

MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

综合介绍 MedRAX是一个专为胸部X光片（CXR）分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型，能够动态处理复杂的医学查询，而无需额外训练。MedRAX通过其模块化设计...

最新AI资源 # AI开源项目 # 智能体应用 # 视觉目标检测

1年前

087.1K

加载更多