Open Codex:将自然语言转换为Shell命令的开源AI工具综合介绍 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在...最新AI资源# AI开源项目1年前070.9K
Neural4D:生成高分辨率3D建模数字资产的AI平台综合介绍 Neural4D 是一个基于人工智能的创新平台,专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发,依托世界领先的端到端3D生成大模型技...最新AI资源# AI开源项目# AI文本与图片转3D1年前070.8K
code2prompt:将代码库转换为大模型可理解的prompt文件综合介绍 code2prompt 是一个开源的命令行工具,由开发者 Mufeed VH 创建并托管在 GitHub 上,旨在帮助用户将整个代码库快速转换为适合大语言模型(LLM)的提示(prompt...最新AI资源# AI开源项目1年前070.8K
QAnything:高度集成RAG处理流程的本地知识库问答系统QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统,支持各类文件格式及数据库,可离线安装使用...最新AI资源# AI开放服务# AI开源项目# 知识检索与RAG框架2年前070.6K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具,旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道,通过参考图像池准确生成各种元素的颜色,包括角色的头发颜色和服...最新AI资源# AI图像风格控制# AI开源项目1年前070.5K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象综合介绍 OASIS(Open Agent Social Interaction Simulations)是一个开源的社交媒体模拟器,能够模拟多达一百万用户的行为。该平台结合了大型语言模型和基于规则的...最新AI资源# AI开源项目# 智能体应用1年前070.5K
Data Formulator:AI驱动的数据可视化工具综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代...最新AI资源# AI开源项目# AI数据分析1年前070.5K
AiPy:自动化运行Python代码完成数据分析任务综合介绍 AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Pytho...最新AI资源# AI开源项目# 桌面自动化智能体1年前070.5K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...最新AI资源# AI开源项目# AI文本与图片转3D1年前070.4K
闲鱼卖家全天自动值守的AI客服机器人综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统,由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守,帮助闲鱼卖家回复...最新AI资源# AI副业赚钱项目# AI客服机器人# AI开源项目1年前070.4K
Austen:分析书籍角色关系并生成图表的AI工具综合介绍 Austen 是一个开源的 AI 工具,它使用 Angular 框架和 Analogjs 初始化,结合 Mermaidjs 技术生成图表,帮助用户分析书籍中的角色关系。用户可以输入 Open...最新AI资源# AI开源项目# AI白板与信息图1年前070.3K
LlamaEdge:本地运行和微调LLM的最快捷方式综合介绍 LlamaEdge是一个开源项目,旨在简化本地或边缘设备上运行和微调大型语言模型(LLM)的过程。该项目支持Llama2系列模型,并提供与OpenAI兼容的API服务,使用户能够轻松创建和运...最新AI资源# AI开源项目# 大模型微调1年前070.3K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景综合介绍 Fay是一个开源的3D虚拟数字人框架,集成了语言模型和数字角色,适用于多种应用场景,如虚拟购物导购、虚拟主播、助理、服务员、教师以及基于语音或文本的移动助手。Fay框架支持全离线使用,提供毫...最新AI资源# AI开源项目# AI数字人1年前070.3K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室(HKUDS)开发的一款开源AI工具,旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造,支持多种大语言模...最新AI资源# AI开源项目# 生成深度研究报告# 论文1年前070.3K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎,旨在提供深入互联网的答案。它使用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,并提供带有引用来源的清晰答案。Perple...最新AI资源# AI开源项目# AI搜索工具1年前070.2K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Ch...最新AI资源# AI开源项目2年前070.2K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音(TTS)模型库,旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格(如性别、音调、说话风...最新AI资源# AI开源项目# AI文本转语音1年前070.2K
VoiceCraft:开源零样本语音克隆与文本转语音工具综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音...最新AI资源# AI开源项目# AI语音克隆2年前070.2K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片...最新AI资源# AI开源项目# 文档提取与清洗1年前070.2K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调综合介绍 UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG(检索增强生成)系统解决方案。该框架基于敏捷部署和模块化构建...最新AI资源# AI开源项目# 知识检索与RAG框架1年前070.1K
CapsWriter-Offline:PC端的语音输入和字幕转录工具综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具,托管于 GitHub,由开发者 HaujetZhao 打造。它完全离线运行,无需联网即可实现语音转文字和音视...最新AI资源# AI开源项目# AI语音转文本1年前070.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...最新AI资源# AI开源项目# 智能体应用# 视觉目标检测1年前070.1K
Probly:AI分析数据并生成图表的开源表格工具综合介绍 Probly 是一个由 PragmaticMachineLearning 团队开发并在 GitHub 上开源的电子表格工具,结合了传统电子表格的功能与强大的 AI 数据分析能力。它不仅支持用...最新AI资源# AI开源项目# AI数据分析1年前070.1K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道综合介绍 无前端,纯配置文件配置 API 渠道。只要写一个文件就能运行起一个属于自己的 API 站,文档有详细的配置指南,小白友好。 uni-api 是一个统一管理大模型API的项目,允许通过一个统一...最新AI资源# AI开源项目1年前070K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端综合介绍 HyperChat 是一个由 BigSweetPotatoStudio 开发的开源聊天客户端,托管于 GitHub,旨在通过集成多个大型语言模型(LLM)的 API(如 OpenAI、Cla...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用1年前069.7K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...最新AI资源# AI开源项目# AI自部署图像生成工具1年前069.7K
MiMo:高效数学推理与代码生成的小型开源模型综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...最新AI资源# AI开源项目12个月前069.7K
Flock:低代码工作流编排快速构建聊天机器人综合介绍 Flock 是一个开源的工作流低代码平台,托管在 GitHub 上,由 Onelevenvy 团队开发。它基于 LangChain 和 LangGraph 技术,专注于帮助用户快速搭建聊天机...最新AI资源# AI客服机器人# AI开源项目# 低代码工作流1年前069.7K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道综合介绍 Yutu 是一个功能强大的开源命令行工具,专为 YouTube 用户设计,托管于 GitHub,由 eat-pray-ai 团队开发。它通过终端操作实现对 YouTube 视频、播放列表、频...最新AI资源# AI开源项目1年前069.6K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本综合介绍 Fragments by E2B是一个开源项目,提供了一个基于Next.js的模板,用于构建完全由AI生成的应用程序。该项目由 E2B 开发,旨在简化和加速AI应用的开发过程。它集成了多种现...最新AI资源# AI开源项目# AI编程1年前069.6K
实时语音转文字的开源工具综合介绍 realtime-transcription-fastrtc 是一个开源项目,专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流,结合本地 Whisper 模型实现高效...最新AI资源# AI开源项目# AI语音转文本1年前069.5K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前069.5K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol(模型上下文协议)的开源工具,托管于 GitHub,由开发者 Zach Caceres ...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗1年前069.3K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低...最新AI资源# AI开源项目# AI语音克隆2年前069.2K
自动爬取小说并生成多角色有声书的工具综合介绍 Auto-Audio-Book 是一个开源项目,托管在 GitHub 上。它能自动从网站爬取小说内容,并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...最新AI资源# AI副业赚钱项目# AI开源项目1年前069K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。综合介绍 Ant Design X是蚂蚁集团开源的一个工具包,旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板,支持与OpenAI标准兼容的模型集成,适用于智能客服、AI助手等多种应...最新AI资源# AI开源项目1年前069K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译1年前069K
Free-Search:免费获取实时谷歌搜索结果的API工具综合介绍 Free-Search 是一个由 Hanzla Javaid 开发的开源 API 工具,托管在 GitHub 上。它的主要功能是通过自定义搜索引擎提供实时的谷歌搜索结果,并爬取网页内容返回结...最新AI资源# AI开源项目1年前069K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI资源# AI开源项目# AI数字人1年前068.9K
openapi-mcp-server:让AI直接调用开放API的MCP服务综合介绍 openapi-mcp-server 是一个开源工具,旨在将符合 OpenAPI v3.1 标准的API转化为AI可用的资源。它由 janwilmake 维护,基于 Model Contex...最新AI资源# AI开源项目# MCP服务1年前068.9K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务综合介绍 Flow是一个轻量级的任务引擎,专为构建AI代理而设计,强调简洁性和灵活性。与传统的基于节点和边的工作流不同,Flow采用动态任务队列系统,支持并行执行、动态调度和智能依赖管理。其核心理念是...最新AI资源# AI开源项目# 低代码工作流1年前068.9K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目1年前068.8K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...最新AI资源# AI开源项目# 桌面自动化智能体1年前068.8K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流综合介绍 Fast-Agent 是一个由 evalstate 团队在 GitHub 上维护的开源工具,旨在帮助开发者快速定义、测试和构建多智能体工作流。它基于简单的声明式语法,支持与 MCP(Mode...最新AI资源# AI开源项目# 智能体开发框架1年前068.8K
RoomGPT:上传房间照片,使用AI重新设计综合介绍 RoomGPT是一个由GitHub用户Nutlope开发的开源项目,允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计...最新AI资源# AI图像风格控制# AI开源项目1年前068.8K
NodeRAG:基于异构图的精准信息检索与生成工具综合介绍 NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。Nod...最新AI资源# AI开源项目# 知识检索与RAG框架1年前068.7K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI资源# AI图像风格控制# AI开源项目1年前068.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic...最新AI资源# AI开源项目# AI数据分析1年前068.7K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端综合介绍 Copilot后端代理服务是一个开源项目,旨在通过借助其他FIM模型(如DeepSeek)来管理GitHub Copilot插件服务端,同时支持多人共享官方账号。该服务支持多种IDE,包括V...最新AI资源# AI开放服务# AI开源项目1年前068.7K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...最新AI资源# AI开放服务# AI开源项目# OCR1年前068.7K
LHM:从单张图片生成支持动作的3D人体模型综合介绍 LHM(Large Animatable Human Reconstruction Model)是一个开源项目,它由aigc3d团队开发,能从一张图片快速生成支持动作的3D人体模型。核心特色...最新AI资源# AI开源项目# AI文本与图片转3D1年前068.6K
TxAgent:帮医生分析药物作用和治疗方案的AI工具综合介绍 TxAgent 是哈佛大学医学与科学人工智能团队(MIMS)开发的一款开源AI工具,旨在帮助医生分析药物相互作用并制定个性化治疗方案。它通过多步骤推理和实时检索生物医学知识,结合患者的具体情...最新AI资源# AI开源项目# 智能体应用1年前068.5K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。综合介绍 一个用于修复无效JSON文件的模块,特别适用于解析由大型语言模型(LLMs)输出的错误JSON数据。该模块能够修复常见的JSON语法错误,如缺失的引号、错误的逗号、不转义的字符和不完整的键值...最新AI资源# AI开源项目2年前068.5K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新AI资源# AI开源项目# OCR2年前068.5K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品1年前068.5K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目1年前068.4K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结综合介绍 AI2SRT是一个开源项目,利用GeminiAI大模型,为长视频一键生成解说短视频和视频总结,同时支持音视频转录字幕。该项目旨在简化视频内容创作过程,提供高效的字幕生成和翻译功能。用户可以通...最新AI资源# AI开源项目# AI音视频编辑1年前068.3K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐1年前068.3K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司,致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...最新AI资源# AI大模型原生对话工具# AI开源项目2年前068.3K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目1年前068.2K
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI资源# AI开源项目# 知识检索与RAG框架1年前068.2K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术,可以将图像进...最新AI资源# AI图像放大与修复# AI开源项目2年前068.1K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用1年前068.1K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体1年前068.1K
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI资源# AI开源项目# 免费大模型API1年前068K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客...最新AI资源# AI开源项目1年前068K
使用Cursor读取并修改Figma设计稿的MCP服务综合介绍 Cursor Talk to Figma MCP 是一个开源项目,通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...最新AI资源# AI开源项目# AI页面设计# MCP服务1年前067.9K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程1年前067.9K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗1年前067.8K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具综合介绍 LazyLLM 是由 LazyAGI 团队开发的一款开源工具,专注于简化多智能体大模型应用的开发流程。它通过一键部署和轻量级网关机制,帮助开发者快速搭建复杂的 AI 应用,节省繁琐的工程配置...最新AI资源# AI开源项目# 智能体开发框架1年前067.8K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制综合介绍 Ruyi-Models 是一个开源项目,旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发,支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...最新AI资源# AI图像转视频# AI开源项目1年前067.7K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...最新AI资源# AI在线生成图像# AI开源项目1年前067.7K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告1年前067.7K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架1年前067.6K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目1年前067.6K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用1年前067.6K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测1年前067.5K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用1年前067.4K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架1年前067.4K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具综合介绍 Bilingual Book Maker 是一个开源项目,旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译,支持多种文件格式,包括epub、txt和srt...最新AI资源# AI开源项目# AI翻译1年前067.4K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目1年前067.4K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐1年前067.3K
xyks:小猿口算逆向笔记,逆向工程与解密算法综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加...最新AI资源# AI开源项目# AI教育工具2年前067.2K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手,旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容,并自动发送跟...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前067.2K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新AI资源# AI开源项目1年前067.1K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用1年前067.1K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR1年前067K
mcp-ui:基于MCP协议的简洁AI聊天界面综合介绍 mcp-ui 是一个开源项目,由开发者 machaojin1917939763 创建,基于 Model Context Protocol(MCP)协议打造,是一款支持 Web 和桌面环境的智...最新AI资源# AI开源项目# AI本地化聊天应用1年前067K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI资源# AI开源项目1年前067K
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI资源# AI开源项目# MCP服务1年前067K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前066.9K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA(Multi-head Latent Attention)解码内核,专为 NVIDIA Hopper 架构 GPU 优化...最新AI资源# AI开源项目1年前066.9K
Deep Recall:为大模型提供企业级记忆框架的开源工具综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...最新AI资源# AI开源项目# 知识检索与RAG框架12个月前066.8K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品1年前066.8K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令,比如“宗介开紫色车兜风”,生成动漫视频,还能让不同动漫角色互动,比如《魔女宅急便》的琪琪和《天空之城...最新AI资源# AI开源项目# AI视频生成工具# AI视频转换风格1年前066.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架综合介绍 OpenAI Agents SDK 是 OpenAI 推出的一款轻量级开发工具,专为构建多智能体工作流设计。它基于 Python,简单易上手,支持开发者通过配置智能体(Agents)、任务切...最新AI资源# AI开源项目# 智能体开发框架1年前066.8K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗1年前066.8K
DeepRant:实时翻译游戏聊天内容的开源客户端综合介绍 DeepRant 是一款专为游戏玩家打造的开源翻译工具,旨在解决国际服务器中语言不通的问题。它通过快捷键实现游戏内文字的即时翻译,支持多种语言互译,让玩家无需退出游戏即可快速理解和回复聊天信...最新AI资源# AI开源项目# AI翻译1年前066.7K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目1年前066.6K