SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台,专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能,帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操...最新AI资源# AI图像生成辅助工具# AI开源项目1年前089.5K
Cog-ComfyUI:使用API运行ComfyUI工作流综合介绍 Cog-ComfyUI是一个开源项目,旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建,提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI1年前089K
Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型综合介绍 Qwen2.5-VL 是阿里巴巴云(Alibaba Cloud)Qwen 团队开发的开源多模态大模型。它能同时处理文本、图像、视频和文档,是 Qwen2-VL 的升级版,基于 Qwen2.5...最新AI资源# AI开源项目1年前089K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库,由南洋理工大学 S-Lab 的研究团队开发,并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器(C...最新AI资源# AI副业赚钱项目# AI图像放大与修复# AI开源项目2年前088.7K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手综合介绍 ComfyUI-Copilot是一个专为ComfyUI框架设计的AI驱动自定义节点,旨在通过自然语言交互提升AI算法调试与部署的效率。它由AIDC-AI团队(阿里巴巴)开发并开源于GitHu...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI1年前088.5K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目,专注于集成 AI 聊天和绘画功能。它完全开源免费,采用 Java17 和 SpringBoot 3.X 技术栈,后台管...最新AI资源# AI副业赚钱项目# AI开源项目1年前088K
bilive:B站无人监守直播录制与自动切片、上传工具综合介绍 bilive是一个专为B站直播录制设计的工具,提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器,支持7x24小时无人值守录制,自动识别并渲染弹幕和字幕,自动切片并...最新AI资源# AI开源项目# AI音视频编辑1年前087.7K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目,由开发者 ngc660sec(云山/eXM)创建并托管于 GitHub。经过两年迭代,目前版本为 V2.3,功能从最初的简单...最新AI资源# AI客服机器人# AI开源项目1年前087.7K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本综合介绍 GitIngest 是一个开源工具,旨在将 GitHub 代码库转化为适合大语言模型(LLM)提示的文本。通过简单的操作,用户可以将任何 GitHub 仓库的内容提取并格式化为适合 LLM ...最新AI资源# AI开源项目# 文档提取与清洗1年前087.6K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新AI资源# AI开源项目1年前087.4K
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...最新AI资源# AI开源项目# 大模型微调1年前087.4K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持综合介绍 知识图谱工作室(Knowledge Graph Studio)是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...最新AI资源# AI开源项目# 知识图谱2年前087.4K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即...最新AI资源# AI开源项目# MCP服务1年前087.3K
文多多 AiPPT:AI生成PPT,演讲稿生成综合介绍 AiPPT 是一个基于人工智能技术的PPT生成工具,旨在帮助用户快速创建专业演示文稿。它通过输入主题、上传文件或提供网址等方式,自动生成内容丰富、设计精美的幻灯片,支持原生图表、动画和3D特...最新AI资源# AI开源项目# AI生成演示文稿/PPT1年前087.3K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用,旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色,满足企业个性化需求,并且具备知识库管理功能,支...最新AI资源# AI开源项目# AI本地化聊天应用1年前087.3K
Mad Professor:辅助阅读和分析学术论文的AI工具综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...最新AI资源# AI开源项目# AI教育工具1年前087.1K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API综合介绍 DDG-Chat 是一个开源项目,旨在提供一个可以一键部署到多种平台的 ChatGPT API 后端。该项目支持多种模型,包括 GPT-4o mini、Claude 3 Haiku、Llam...最新AI资源# AI开源项目# 免费大模型API2年前087.1K
InternVL:开源多模态大模型,支持图像、视频和文本处理综合介绍 InternVL 是由上海人工智能实验室(OpenGVLab)开发的一个开源多模态大模型项目,托管在 GitHub 上。它集成了视觉和语言处理能力,支持图像、视频和文本的综合理解与生成。In...最新AI资源# AI开源项目1年前087K
Kokoro WebGPU:浏览器中离线运行的文本转语音服务综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...最新AI资源# AI开源项目# AI文本转语音1年前087K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台,适用于个人使用。该项目...最新AI资源# AI开源项目1年前086.9K
ImBD:AI生成内容检测,检测内容是否由人工智能生成综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别A...最新AI资源# AI开源项目# AI教育工具1年前086.4K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT综合介绍 PPTAgent是一个创新的系统,旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法,采用两步流程确保内容质量和视觉效果。此外,PPTAgent还引入了PPTEval,一个全面...最新AI资源# AI开源项目# AI生成演示文稿/PPT1年前086.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用综合介绍 MNN(Mobile Neural Network)是阿里巴巴开发的一个高效、轻量级的深度学习框架,专为移动端设备优化。MNN不仅能够在移动设备上进行快速推理,还支持多模态任务,包括文本生成...最新AI资源# AI开源项目# AI本地化聊天应用1年前086.2K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑综合介绍 Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git...最新AI资源# AI开源项目# AI编程1年前086.1K
One API:多模型API管理与负载均衡,分发系统综合介绍 One API 是一个开源的接口管理与分发系统,支持多种大模型如 OpenAI ChatGPT、Anthropic Claude、Google PaLM 2 & Gemini 等。该...最新AI资源# AI开源项目2年前086.1K
IC-Light(V2):图像照明控制神器,控制图像光影和背景综合介绍 IC-Light是一个用于图像照明控制的项目,旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发,提供了两种主要模型:文本条件重光模型和背景条件模型。用户可以通...最新AI资源# AI图像风格控制# AI开源项目1年前085.8K
PPTX2MD:将PPTX文件转换为Markdown的专用工具综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超...最新AI资源# AI开源项目# 文档提取与清洗1年前085.7K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程综合介绍 RD-Agent是由微软推出的一款开源工具,旨在自动化和优化研究与开发(R&D)过程。该工具专注于数据驱动的场景,通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...最新AI资源# AI开源项目# 智能体应用1年前085.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架综合介绍 Eliza是一个先进的多智能体(Multi-Agent)开发框架,致力于简化自主智能体(Autonomous Agent)的构建和部署过程。它支持部署多个具有不同角色设定的智能体,可实现智能...最新AI资源# AI开源项目# 智能体开发框架1年前085.3K
Orama:高性能全文本和向量搜索引擎综合介绍 Orama 是一个开源的高性能搜索引擎,完全用 TypeScript 编写,支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作,提供快速、可靠...最新AI资源# AI开源项目# 知识检索与RAG框架1年前085.1K
Stagehand:自然语言实现浏览器自动化操作框架综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...最新AI资源# AI开源项目# 桌面自动化智能体1年前085.1K
AutoGen Studio:多代理系统AutoGen的简易用户界面版综合介绍 AutoGen Studio 2.0 是一个由 AutoGen 提供支持的用户界面,旨在简化创建和管理多代理解决方案的过程。该平台通过直观的界面,使用户能够声明性地定义和修改代理及其工作流程...最新AI资源# AI开源项目# 智能体开发框架1年前085K
GraphRAG-Dify:让Dify具备GraphRAG能力综合介绍 GraphRAG-Dify是一个开源项目,旨在结合GraphRAG和Dify技术,快速创建和部署AI Agent。该项目利用FastAPI和Uvicorn进行服务搭建,并支持DSL导入,方便...最新AI资源# AI开源项目# 知识图谱2年前085K
OpenAvatarChat:模块化设计的数字人对话工具综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目,托管在 GitHub 上。它是一个模块化的数字人对话工具,用户可以在单台 PC 上运行...最新AI资源# AI开源项目# 多模态实时互动产品1年前084.9K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型综合介绍 DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型,显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文...最新AI资源# AI开源项目# 多模态实时互动产品1年前084.7K
AutoDev:支持多语言的自动代码生成与调试工具综合介绍 AutoDev 是一个由 Unit Mesh 团队开发的开源项目,托管在 GitHub 上,旨在通过人工智能技术提升开发者的编程效率。它是一个功能强大的编码助手,支持多种编程语言,包括 Ja...最新AI资源# AI开源项目# AI编程1年前084.7K
无服务器快速部署Grok3国内镜像站综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型,而 ...最新AI资源# AI开源项目1年前084.5K
TubeTube:自部署YouTube视频下载工具综合介绍 TubeTube是一个开源的YouTube视频下载工具,由MattBlackOnly开发。该工具使用yt-dlp作为核心下载引擎,支持多线程下载,能够快速同时下载多个视频。用户可以通过YAM...最新AI资源# AI开源项目1年前084.4K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片综合介绍 InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装2年前084.4K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI资源# AI开源项目# AI编程# 智能体开发框架1年前084.3K
MobileAgent:多代理协作的移动设备操作助手综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...最新AI资源# AI开源项目# 桌面自动化智能体1年前084K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具综合介绍 Cursor Auto Register 是一个开源项目,托管在 GitHub 上。它由开发者 ddCat-main 创建,旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号...最新AI资源# AI开源项目1年前083.9K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)综合介绍 Anon-Kode 是一个基于终端操作的开源AI代码助手,由开发者 Daniel Nakov 在 GitHub 上推出。它专为程序员设计,通过集成支持 OpenAI 风格 API 的语言模型...最新AI资源# AI开源项目# AI编程1年前083.9K
Abogen:将多种文本格式转换为有声读物的工具综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...最新AI资源# AI开源项目# AI语音转文本1年前083.8K
FreeAI:基于Pollinations封装的的免费AI工具综合介绍 FreeAI 是一个基于 Pollinations.AI API 的开源 AI 应用平台,提供免费且无限制的 AI 聊天助手、图像生成和语音合成服务。这个项目由开发者 Azad-sl 在 G...最新AI资源# AI开源项目# AI集成多模型对话平台1年前083.8K
GFPGAN:腾讯开源的人脸修复算法综合介绍 GFPGAN(Generative Facial Prior GAN)是由腾讯ARC(Applied Research Center)开发的一种开源人脸修复算法。该算法利用预训练的面部GAN...最新AI资源# AI图像放大与修复# AI开源项目2年前083.8K
VoltAgent:快速构建AI智能体的TypeScript开源框架综合介绍 VoltAgent 是一个开源的 TypeScript 框架,专为开发者设计,帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式,简化了与大型语言模型(LLM)交互、状态...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架1年前083.6K
Moffee:将Markdown转为PPT幻灯片综合介绍 Moffee 是一个开源工具,它能把 Markdown 文件快速变成专业的幻灯片,简单又高效。用户只需写好 Markdown 内容,Moffee 就能自动处理布局、分页和样式,省去手动排版的...最新AI资源# AI开源项目# AI生成演示文稿/PPT1年前083.6K
AgenticSeek:完全本地运行的任务自动化AI助手综合介绍 AgenticSeek 是一个完全本地运行的开源AI助手,基于 Deepseek R1 模型开发。它不需要云端API,也不产生每月数百美元的费用。它的目标是成为类似电影中“贾维斯”的智能助手...最新AI资源# AI开源项目# 智能体应用1年前083.4K
Step1X-Edit:自然语言指令编辑图像的开源工具综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然...最新AI资源# AI图像编辑# AI开源项目1年前083.4K
TimesFM 2.0:谷歌开源进行时间序列预测的预训练模型综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...最新AI资源# AI开源项目1年前083.3K
阿布量化交易系统:基于Python的开源量化交易平台综合介绍 阿布量化交易系统是一个基于Python开发的开源平台。它由用户“bbfamily”创建,旨在帮助投资者通过代码实现量化交易策略。系统支持股票、期权、期货和比特币等多种金融产品的回测与交易。它...最新AI资源# AI开源项目# AI金融数据分析1年前083.3K
MCP Playwright:提供浏览器自动化操作的MCP服务综合介绍 MCP-Playwright 是一个由 ExecuteAutomation 开发并托管在 GitHub 上的开源工具。它基于 Playwright 和 Model Context Proto...最新AI资源# AI开源项目# MCP服务1年前083.2K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...最新AI资源# AI开源项目# AI文本转语音1年前083.1K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应...最新AI资源# AI开源项目# AI语音克隆2年前083.1K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI资源# AI开源项目# AI语音转文本1年前082.8K
InstantCharacter:从单张图片生成一致性角色的开源工具综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图...最新AI资源# AI图像风格控制# AI开源项目1年前082.5K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字...最新AI资源# AI开源项目# AI语音转文本2年前082.5K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用综合介绍 Steel Browser是一个开源的浏览器API,专为AI代理和应用程序设计。它提供了一个完整的浏览器实例,允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...最新AI资源# AI开源项目2年前082.5K
Local Deep Research:本地运行的生成深度研究报告工具综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...最新AI资源# AI开源项目# 生成深度研究报告1年前082.4K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全综合介绍 NSFW Detector 是一个基于 AI 的不适内容检测工具,主要用于检测图像、视频、PDF 文件等是否包含不适内容。该工具采用了 Falconsai/nsfwimagedetectio...最新AI资源# AI图像生成辅助工具# AI开源项目2年前082.4K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型,专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化,具有卓越的文本生成和对话能力...最新AI资源# AI开源项目# AI角色扮演1年前082.4K
Unsloth:高效微调和训练大语言模型的开源工具综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...最新AI资源# AI开源项目# 大模型微调1年前082.3K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器综合介绍 Browser-Use是一个创新的开源网页自动化工具,专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架,支持多种主流语言模型,包括GPT-4、Claud...最新AI资源# AI开源项目# 桌面自动化智能体1年前082.1K
Klee:桌面本地运行AI大模型并管理私人知识库综合介绍 Klee 是一个开源桌面应用程序,旨在帮助用户在本地运行开源大语言模型(LLM),并提供安全的私人知识库管理和 Markdown 笔记功能。它基于 Ollama 和 LlamaIndex 技...最新AI资源# AI开源项目# AI本地化聊天应用1年前082.1K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...最新AI资源# AI开源项目# 文档提取与清洗1年前082.1K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程综合介绍 Hugging Face的Open R1项目是一个完全开源的DeepSeek-R1复现项目,旨在构建R1管道的缺失部分,使每个人都能复现并在其基础上进行构建。该项目设计简单,主要包括训练和评...最新AI资源# AI开源项目1年前082K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架,具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用,如浏览器助手、代码解释器和自定义助手...最新AI资源# AI开源项目# 智能体开发框架1年前081.8K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆1年前081.7K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图综合介绍 tldraw是一款免费且即时的协作绘图工具,提供一个无限画布,用户可以快速绘制图形、撰写文字并进行即时协作。具备界面直观、性能优秀的特点,适用于团队协作和远程工作。通过开源社区支持,tldr...最新AI资源# AI开源项目# AI白板与信息图2年前081.7K
VLM-R1:通过自然语言定位图像目标的视觉语言模型综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目,托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法,结合 Qwen2.5-VL 模型,通过强化学习...最新AI资源# AI开源项目# 视觉目标检测1年前081.7K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架,旨在简化和自动化日常计算机任务,使人工智能更易于使用。它通过模块化设计和预设提示词(Patterns)帮助用户高效...最新AI资源# AI开源项目# PROMPTS辅助工具2年前081.5K
优化代码生成和展示的Open WebUI综合介绍 Open WebUI Artifacts Overhaul 是基于 Open WebUI 的一个分支项目,由开发者 Nick Tonjum 开发。它是一个开源工具,专注于提升 AI 生成代码...AI新闻# AI开源项目# AI本地化聊天应用1年前081.5K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能综合介绍 KTransformers:专为突破大模型推理瓶颈而生的高性能 Python 框架。 它不仅仅是一个简单的模型运行工具,更是一套 极致的性能优化引擎 和 灵活的接口赋能平台。 KTransf...最新AI资源# AI开源项目1年前081.4K
Magic MCP:生成现代化UI组件的MCP服务综合介绍 Magic MCP 是由 21st.dev 团队开发的一款 AI 驱动工具,专为前端开发者设计。它能通过自然语言描述即时生成现代化的 UI 组件,集成在 Cursor、WindSurf 和 ...最新AI资源# AI开源项目# AI页面设计# MCP服务1年前081.3K
TANGO:语音生成协调手势人像视频的工具,全身像数字人综合介绍 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...最新AI资源# AI开源项目# AI数字人1年前081.2K
FinGPT:开源金融大语言模型平台,助力金融分析与预测综合介绍 FinGPT 是由 AI4Finance 基金会开发的开源金融大语言模型平台,专为金融领域设计,旨在解决复杂的金融任务,并推动金融科技的创新发展。FinGPT 利用轻量化适配技术和强化学习方...最新AI资源# AI开源项目# AI金融数据分析1年前081.1K
Whisper Input:利用Groq免费且高速的语音转录文本服务综合介绍 Whisper Input 是一个开源的语音转译工具,用户可以通过按下 Option 按钮开始录制语音,抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...最新AI资源# AI开源项目# AI语音转文本1年前081.1K
BlenderMCP:依赖Blender生成3D模型的MCP服务综合介绍 BlenderMCP 是一个开源工具,它通过 Model Context Protocol (MCP) 协议将 Blender 与 Claude AI 连接起来。用户可以用文字指令直接控制 ...最新AI资源# AI开源项目# AI文本与图片转3D# MCP服务1年前081K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据综合介绍 A_Share_investment_Agent 是一个基于多智能体系统的A股投资决策辅助工具。该系统旨在通过多个协作智能体来分析市场数据、计算股票内在价值、分析市场情绪以及基本面数据,从而...最新AI资源# AI开源项目# AI金融数据分析1年前080.9K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲综合介绍 DiffRhythm 是由 ASLP-lab(西北工业大学音频、语音与语言处理小组)开发的一个开源项目,专注于通过人工智能技术实现端到端的音乐创作。它基于潜扩散模型(Latent Diffu...最新AI资源# AI开源项目# AI音乐1年前080.9K
MathTranslate:科学论文LaTeX翻译工具综合介绍 MathTranslate 是一个专门用于翻译 LaTeX 文档的在线工具,特别适用于科学论文的翻译。该工具能够保持 LaTeX 表达式(如数学表达式)不变,并最终将 LaTeX 文档编译成...最新AI资源# AI开源项目# AI翻译# 论文1年前080.7K
A2A:谷歌发布AI智能间通信的开放协议综合介绍 A2A(Agent2Agent)是谷歌开发的一个开源协议,目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法,让智能体可以发现彼此的能力、分担任务并完成工作...最新AI资源# AI开源项目# 智能体开发框架1年前080.7K
Motia:用代码快速构建智能体的开发框架综合介绍 Motia 是一个面向软件工程师的开源 AI 代理框架,托管在 GitHub 上,由 MotiaDev 团队开发。它让开发者能用熟悉的编程语言(如 Python、TypeScript、Rub...最新AI资源# AI开源项目# 智能体开发框架1年前080.7K
Dia:生成超现实多人对话的文本转语音模型综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表...最新AI资源# AI开源项目# AI文本转语音1年前080.7K
CrewAI:多角色扮演协作智能框架,简化复杂任务综合介绍 CrewAI 是一个先进的框架,旨在协调角色扮演和自主AI代理的协作。通过促进协作智能,CrewAI 使代理能够无缝协作,解决复杂任务。无论是构建智能助手平台、自动化客户服务团队,还是多代理...最新AI资源# AI开源项目# 智能体开发框架1年前080.5K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端综合介绍 AigcPanel是一款面向所有用户的一站式AI数字人制作系统,采用electron+vue3+typescript技术栈开发,支持Windows系统一键部署。系统设计以用户友好为核心,即使...最新AI资源# AI开源项目# AI数字人1年前080.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台综合介绍 Comp AI 是一个开源平台,由 Comp AI, Inc. 开发,总部位于美国旧金山。它帮助企业通过自动化工具快速完成 SOC 2、ISO 27001 和 GDPR 等合规要求,目标是几...最新AI资源# AI开源项目# 专业生产力工具1年前080.4K
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI资源# AI开源项目# AI抠图改背景12个月前080.2K
Firecrawl MCP Server:基于 Firecrawl 的网页爬虫 MCP 服务综合介绍 Firecrawl MCP Server 是由 MendableAI 开发的一款开源工具,基于 Model Context Protocol (MCP) 协议实现,与 Firecrawl A...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗1年前080.2K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。S...最新AI资源# AI开源项目# AI数字人1年前080.1K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型综合介绍 Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试...最新AI资源# AI开源项目# AI换脸与换装1年前080.1K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑综合介绍 TRELLIS是一个由Microsoft开发的大型3D资产生成模型。它能够接收文本或图像提示,并生成各种格式的高质量3D资产,如辐射场、3D高斯和网格。TRELLIS的核心是统一的结构化潜在...最新AI资源# AI开源项目# AI文本与图片转3D2年前080.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。综合介绍 OpenWebUI-Monitor 是一个用于监控 OpenWebUI 用户活动和管理使用限额的仪表板。它可以高效地设置用户配额,实时查看用户数据和可视化信息,支持一键部署,方便用户管理和监...最新AI资源# AI副业赚钱项目# AI开源项目2年前080K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...最新AI资源# AI开源项目# 文档提取与清洗2年前079.9K
语析(Yuxi-Know):基于知识图谱的智能问答平台综合介绍 Yuxi-Know 是一个开源的智能问答平台,结合知识图谱和 RAG(检索增强生成)技术,帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱,使用 FastAPI 和 VueJS 构...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前079.9K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存综合介绍 InstantIR 是由 InstantX 团队开发的一款创新的单图像修复模型,旨在复活您损坏的图像,提供极高质量且逼真的细节,能够对受损图像进行高质量的修复。该工具不仅可以恢复图像的细节...最新AI资源# AI图像放大与修复# AI开源项目2年前079.9K
Agent TARS:使用视觉和命令操作电脑的开源智能体综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...最新AI资源# AI开源项目# 桌面自动化智能体1年前079.8K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川...最新AI资源# AI开源项目# AI语音克隆# 多模态实时互动产品1年前079.8K