Agent TARS:使用视觉和命令操作电脑的开源智能体综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...最新AI资源# AI开源项目# 桌面自动化智能体7个月前026.3K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模...最新AI资源# AI开源项目# 无代码开发# 知识检索与RAG框架9个月前026.3K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI资源# AI开源项目# AI翻译# AI语音转文本11个月前026.3K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持综合介绍 知识图谱工作室(Knowledge Graph Studio)是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...最新AI资源# AI开源项目# 知识图谱10个月前026.3K
BiliNote:从视频自动生成Markdown笔记的AI工具综合介绍 BiliNote 是一款开源的 AI 视频笔记工具,支持从哔哩哔哩和 YouTube 视频链接中提取内容,自动生成结构清晰的 Markdown 格式笔记。它利用本地音频转写和多种大模型(如 ...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI笔记6个月前026.3K
Yek:读取git仓库文本文件并快速分块,以供大模型使用综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...最新AI资源# AI开源项目# 文档提取与清洗9个月前026.3K
Easy Dataset:创建大模型微调数据集的简易工具综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合...最新AI资源# AI开源项目# 大模型微调7个月前026.3K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI资源# AI开源项目# AI数字人11个月前026.3K
Voice Changer:实时语音变换工具,让喜欢的动漫角色唱歌综合介绍 Voice Changer 是一个开源的实时语音变换工具,支持多种 AI 语音模型,如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台...最新AI资源# AI开源项目# AI语音克隆1年前026.3K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...最新AI资源# AI开源项目# MCP服务5个月前026.3K
MathTranslate:科学论文LaTeX翻译工具综合介绍 MathTranslate 是一个专门用于翻译 LaTeX 文档的在线工具,特别适用于科学论文的翻译。该工具能够保持 LaTeX 表达式(如数学表达式)不变,并最终将 LaTeX 文档编译成...最新AI资源# AI开源项目# AI翻译# 论文9个月前026.3K
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI资源# AI开源项目# 免费大模型API8个月前026.2K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译8个月前026.2K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI综合介绍 ChatOllama是一个基于大型语言模型(LLM)的开源在线聊天应用项目,支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理(列表展示、下载、删除)、与模型聊天等功能。项目运用了...最新AI资源# AI开源项目# AI本地化聊天应用# 知识检索与RAG框架1年前026.2K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI资源# AI开源项目# 文档提取与清洗10个月前026.2K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频DreamTalk 综合介绍 DreamTalk是一个扩散模型驱动的表情说话头生成框架,由清华大学、阿里巴巴集团和华中科技大学联合开发。主要由降噪网络、风格感知嘴唇专家和风格预测器三部分构成,能够基于...最新AI资源# AI开源项目# AI数字人# 口型同步10个月前026.2K
Deep Chat:快速集成到网站的AI聊天组件综合介绍 Deep Chat 是一个开源的 AI 聊天组件,专为网站开发者设计。它由 Ovidijus Parsiunas 开发,托管在 GitHub 上,目前已有超过 2k 星标。用户可以通过简单配...最新AI资源# AI客服机器人# AI开源项目6个月前026.2K
STAR:空间时序增强AI模型,提升视频分辨率清晰度综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...最新AI资源# AI图像放大与修复# AI开源项目9个月前026.1K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像综合介绍 Watermark Removal 是一个开源项目,利用机器学习和深度学习技术进行图像修复,专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发,灵感来源于 Con...最新AI资源# AI开源项目# AI抠图改背景8个月前026.1K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频综合介绍 MoneyPrinterTurbo 是一个开源项目,利用先进的AI大模型技术,实现了一键生成高清短视频的功能。用户只需提供一个视频主题或关键词,系统便会自动生成视频文案、视频素材、视频字幕和...最新AI资源# AI开源项目# AI视频生成工具7个月前026.1K
Zola:支持文档上传与多模型的开源AI聊天Web应用综合介绍 Zola 是一个免费且开源的 AI 聊天应用,由开发者 Julien Thibeaut(GitHub 用户名 ibelick)开发,托管在 GitHub 上。它最大的特点是支持多种 AI 模...最新AI资源# AI开源项目# AI本地化聊天应用# AI集成多模型对话平台6个月前026.1K
LlamaCoder:使用提示词快速生成并发布小型web应用综合介绍 LlamaCoder 是一个基于 Llama 3.1 和 Together AI 的开源代码生成工具。它可以通过简单的提示生成小型应用程序,适合开发者快速实现创意。LlamaCoder 提供...最新AI资源# AI开源项目# AI编程# AI页面设计10个月前026.1K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流综合介绍 腾讯混元3D(Hunyuan3D 2.0)是腾讯推出的先进大规模3D合成系统,旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理...最新AI资源# AI开源项目# AI文本与图片转3D9个月前026.1K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT综合介绍 PPTAgent是一个创新的系统,旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法,采用两步流程确保内容质量和视觉效果。此外,PPTAgent还引入了PPTEval,一个全面...最新AI资源# AI开源项目# AI生成演示文稿/PPT9个月前026.1K
在 Cloudflare Workers 中快速部署 MCP 服务综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目,托管于 GitHub,旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的...最新AI资源# AI开源项目# MCP服务7个月前026.1K
MTEB:评估文本嵌入模型性能的基准测试综合介绍 MTEB(Massive Text Embedding Benchmark)是一个由 embeddings-benchmark 团队开发并托管在 GitHub 上的开源项目,旨在为文本嵌入模...最新AI资源# AI开源项目7个月前026K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端综合介绍 HyperChat 是一个由 BigSweetPotatoStudio 开发的开源聊天客户端,托管于 GitHub,旨在通过集成多个大型语言模型(LLM)的 API(如 OpenAI、Cla...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用7个月前026K
Local-NotebookLM:本地PDF生成语音播客的开源工具综合介绍 Local-NotebookLM 是一个开源项目,旨在提供本地运行的智能文档处理与内容生成工具。它受到 Google NotebookLM 的启发,专注于帮助用户将 PDF 等文档转化为多种...最新AI资源# AI开源项目# AI语音转文本7个月前026K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...最新AI资源# AI在线生成图像# AI开源项目10个月前026K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率综合介绍 Make Sense 是一个免费的在线图像标注工具,旨在帮助用户快速为计算机视觉项目准备数据集。它无需复杂安装,只需打开浏览器访问即可使用,支持多种操作系统,非常适合小型深度学习项目。用户可...最新AI资源# AI开源项目# 视觉目标检测8个月前026K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)综合介绍 AI Auto Free 是一个强大的自动化工具,旨在帮助用户无限制地使用AI驱动的集成开发环境(IDE),如 Cursor 和 Windsurf 。该项目提供跨平台支持,并包含多种语言功能...最新AI资源# AI开源项目9个月前026K
Zed:Rust开发的高性能多人协作代码编辑器综合介绍 Zed 是由 Atom 和 Tree-sitter 的创造者开发的一款高性能、多用户协作的代码编辑器。Zed 采用 Rust 语言编写,旨在提供快速、流畅的编码体验。其主要特点包括支持多人实...最新AI资源# AI IDE# AI开源项目# AI编程10个月前026K
ell:轻量级函数式提示词工程框架综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化...最新AI资源# AI开源项目# PROMPTS辅助工具8个月前026K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架7个月前026K
RLAMA:命令行操作的本地文档智能问答 RAG 系统综合介绍 RLAMA 是一个由 DonTizi 开源开发并托管于 GitHub 的文档智能问答 RAG(检索增强生成)系统,其核心特色在于通过命令行操作实现功能。用户可以通过简洁的终端命令,连接本地 ...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前026K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道综合介绍 Yutu 是一个功能强大的开源命令行工具,专为 YouTube 用户设计,托管于 GitHub,由 eat-pray-ai 团队开发。它通过终端操作实现对 YouTube 视频、播放列表、频...最新AI资源# AI开源项目7个月前025.9K
Step1X-Edit:自然语言指令编辑图像的开源工具综合介绍 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然...最新AI资源# AI图像编辑# AI开源项目5个月前025.9K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式综合介绍 CoAI.Dev (原 Chat Nio) 是一个集成多种AI模型的聊天平台,支持分布式流式传输、图像生成、跨设备对话同步及分享等功能。它实现了订阅和Token计费系统,Key中转服务以及多...最新AI资源# AI副业赚钱项目# AI开源项目# AI本地化聊天应用11个月前025.9K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用7个月前025.9K
promptfoo:提供安全可靠的LLM应用测试工具综合介绍 promptfoo 是一个开源的命令行工具和库,专门用于评估和红队测试大语言模型(LLM)应用。它为开发者提供了一套完整的工具,用于构建可靠的提示、模型和基于检索的生成(RAGs),并通过自...最新AI资源# AI开源项目8个月前025.9K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性综合介绍 NVIDIA Garak 是一款开源工具,专门用于检测大型语言模型(LLM)的漏洞。它通过静态、动态和自适应探测,检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱...最新AI资源# AI开源项目# 大模型微调11个月前025.9K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型综合介绍 Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试...最新AI资源# AI开源项目# AI换脸与换装10个月前025.8K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目,由开发者 ngc660sec(云山/eXM)创建并托管于 GitHub。经过两年迭代,目前版本为 V2.3,功能从最初的简单...最新AI资源# AI客服机器人# AI开源项目7个月前025.8K
mcp-ui:基于MCP协议的简洁AI聊天界面综合介绍 mcp-ui 是一个开源项目,由开发者 machaojin1917939763 创建,基于 Model Context Protocol(MCP)协议打造,是一款支持 Web 和桌面环境的智...最新AI资源# AI开源项目# AI本地化聊天应用6个月前025.8K
Flock:低代码工作流编排快速构建聊天机器人综合介绍 Flock 是一个开源的工作流低代码平台,托管在 GitHub 上,由 Onelevenvy 团队开发。它基于 LangChain 和 LangGraph 技术,专注于帮助用户快速搭建聊天机...最新AI资源# AI客服机器人# AI开源项目# 低代码工作流8个月前025.8K
BlenderMCP:依赖Blender生成3D模型的MCP服务综合介绍 BlenderMCP 是一个开源工具,它通过 Model Context Protocol (MCP) 协议将 Blender 与 Claude AI 连接起来。用户可以用文字指令直接控制 ...最新AI资源# AI开源项目# AI文本与图片转3D# MCP服务7个月前025.8K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流综合介绍 Fast-Agent 是一个由 evalstate 团队在 GitHub 上维护的开源工具,旨在帮助开发者快速定义、测试和构建多智能体工作流。它基于简单的声明式语法,支持与 MCP(Mode...最新AI资源# AI开源项目# 智能体开发框架7个月前025.7K
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI资源# AI开源项目# AI抠图改背景4个月前025.7K
KrillinAI:一键翻译和配音的视频多语言全球化工具综合介绍 KrillinAI 是一个开源的视频处理工具,专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始,一直到生成适配不同平台的成品,全程只需几次点击。开发者在 GitHub 上提供了...最新AI资源# AI开源项目# AI翻译4个月前025.7K
Vercel AI SDK:使用流行前端框架构建AI驱动应用程序综合介绍 Vercel AI SDK 是一款由 Vercel 团队开发的开源工具,旨在帮助开发者使用 React、Svelte、Vue 和 Solid 等框架构建人工智能应用。它支持多种语言模型供应商...最新AI资源# AI开源项目9个月前025.7K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具综合介绍 AnimatedDrawings 是由 Facebook Research 开发的一个开源项目,旨在通过自动化技术将儿童的绘画作品转化为动画角色。该项目基于论文《A Method for A...最新AI资源# AI图像转视频# AI开源项目# AI涂鸦生成绘画10个月前025.7K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新AI资源# AI开源项目8个月前025.7K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目10个月前025.7K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调综合介绍 UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG(检索增强生成)系统解决方案。该框架基于敏捷部署和模块化构建...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前025.7K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...最新AI资源# AI开源项目# 桌面自动化智能体9个月前025.7K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能,帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户,能够处理...最新AI资源# AI开源项目# 知识图谱9个月前025.6K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...最新AI资源# AI开源项目# 多模态实时互动产品9个月前025.6K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR6个月前025.6K
Stagehand:自然语言实现浏览器自动化操作框架综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...最新AI资源# AI开源项目# 桌面自动化智能体9个月前025.6K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架,旨在简化和自动化日常计算机任务,使人工智能更易于使用。它通过模块化设计和预设提示词(Patterns)帮助用户高效...最新AI资源# AI开源项目# PROMPTS辅助工具12个月前025.6K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...最新AI资源# AI开源项目6个月前025.6K
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API综合介绍 AIstudioProxyAPI 是一个开源项目,使用 Node.js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的...最新AI资源# AI开源项目# 免费大模型API5个月前025.6K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新AI资源# AI开源项目# OCR1年前025.6K
Firecrawl MCP Server:基于 Firecrawl 的网页爬虫 MCP 服务综合介绍 Firecrawl MCP Server 是由 MendableAI 开发的一款开源工具,基于 Model Context Protocol (MCP) 协议实现,与 Firecrawl A...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗7个月前025.6K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪综合介绍 MoneyPrinterPlus 是一个开源项目,旨在通过AI技术一键生成和混剪各类短视频,并自动发布到多个视频平台,如抖音、快手、小红书和视频号。该工具支持本地和云端语音模型,包括chat...最新AI资源# AI副业赚钱项目# AI开源项目# AI视频生成工具1年前025.5K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows...最新AI资源# AI开源项目# AI语音克隆10个月前025.5K
Agent S:像人类一样操作电脑的开源智能体框架综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任...最新AI资源# AI开源项目# 桌面自动化智能体6个月前025.5K
Muyan-TTS:个性化播客语音训练与合成综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3...最新AI资源# AI开源项目# AI文本转语音5个月前025.5K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI资源# AI开源项目# AI教育工具# AI文本转视频12个月前025.5K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富综合介绍 UltraPixel 是一项先进的超高分辨率图像生成技术,旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发,并在 NeurIPS 2024 上展示。U...最新AI资源# AI在线生成图像# AI开源项目1年前025.5K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本9个月前025.5K
XRAG:优化检索增强生成系统的可视化评估工具综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前025.5K
PRAG:提升问答系统性能的参数化检索增强生成工具综合介绍 PRAG(Parametric Retrieval-Augmented Generation)是一个创新的检索增强生成工具,旨在通过将外部知识直接嵌入大语言模型(LLM)的参数空间,提升生成...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前025.4K
WeClone:用微信聊天记录和语音训练数字分身综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...最新AI资源# AI开源项目# 大模型微调6个月前025.4K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用11个月前025.4K
RoomGPT:上传房间照片,使用AI重新设计综合介绍 RoomGPT是一个由GitHub用户Nutlope开发的开源项目,允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计...最新AI资源# AI图像风格控制# AI开源项目11个月前025.4K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性综合介绍 FitDiT是一个基于扩散变换器(Diffusion Transformers)的高保真虚拟试衣系统。该项目由腾讯AI Lab开发,旨在解决传统虚拟试衣系统在展示服装细节时的局限性。FitD...最新AI资源# AI开源项目# AI换脸与换装9个月前025.4K
NarratoAI:文本生成影视解说与自动化剪辑神器综合介绍 NarratoAI 是一个集影视解说、自动化剪辑、配音和字幕生成于一体的全自动化工具。它依托大型语言模型(LLM)技术,自动生成文案,并自动剪辑视频,配上相应的配音和字幕,为用户提供一站式的...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转视频1年前025.4K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目10个月前025.3K
Baichuan-Audio:支持实时语音交互的端到端音频模型综合介绍 Baichuan-Audio 是由百川智能(baichuan-inc)开发的一个开源项目,托管于 GitHub 上,专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架,能够将语音...最新AI资源# AI开源项目# 多模态实时互动产品8个月前025.3K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息综合介绍 MCP Server ChatSum 是一个开源项目,旨在帮助用户查询和总结聊天消息。该项目托管在 GitHub 上,提供了一个强大的工具集,允许用户根据特定参数查询聊天记录,并生成相应的总...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# MCP服务7个月前025.3K
Oliva:语音控制的多智能体产品搜索助手综合介绍 Oliva 是一个开源的多智能体助手工具,由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作,帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...最新AI资源# AI开源项目# 智能体应用# 知识检索与RAG框架7个月前025.3K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号综合介绍 微信 Markdown 编辑器(WeChat Markdown Editor)是一款高度简洁的微信图文排版工具,旨在帮助用户轻松创建美观的微信文章。该编辑器支持所有基础的 Markdown ...最新AI资源# AI开源项目# AI生活效率助手9个月前025.3K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具综合介绍 LazyLLM 是由 LazyAGI 团队开发的一款开源工具,专注于简化多智能体大模型应用的开发流程。它通过一键部署和轻量级网关机制,帮助开发者快速搭建复杂的 AI 应用,节省繁琐的工程配置...最新AI资源# AI开源项目# 智能体开发框架8个月前025.3K
Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...最新AI资源# AI开源项目# AI生活效率助手# 大模型微调7个月前025.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)综合介绍 AingDesk是一款开源且免费的软件,旨在帮助用户轻松地在本地计算机上部署和运行各种AI模型。无论是 DeepSeek 还是 Llama 模型,AingDesk都能通过简单的操作步骤实现一...最新AI资源# AI开源项目# AI本地化聊天应用8个月前025.3K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片综合介绍 InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装1年前025.3K
CogVLM2:开源多模态模型,支持视频理解与多轮对话综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新AI资源# AI开源项目# 视觉目标检测8个月前025.3K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用,专为 Android 设备设计。用户可以通过连接蓝牙耳机,将手机放在口袋中,与他人进行如同对方说自己语言的对话。RTransla...最新AI资源# AI开源项目# AI翻译9个月前025.3K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司,致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...最新AI资源# AI大模型原生对话工具# AI开源项目12个月前025.3K
阿布量化交易系统:基于Python的开源量化交易平台综合介绍 阿布量化交易系统是一个基于Python开发的开源平台。它由用户“bbfamily”创建,旨在帮助投资者通过代码实现量化交易策略。系统支持股票、期权、期货和比特币等多种金融产品的回测与交易。它...最新AI资源# AI开源项目# AI金融数据分析7个月前025.3K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频综合介绍 TRV 是一个开源工具,托管于 GitHub,旨在帮助用户将幻灯片和演讲笔记快速转化为带有旁白的视频。它通过简单的命令行操作,将输入的演示文稿文件自动生成音频和视频内容,适合需要快速制作演示...最新AI资源# AI开源项目# AI视频生成工具8个月前025.3K
Zonos:高质量语音合成与语音克隆工具综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型,能够生成高质量的语音输出。该工具支持多种语言...最新AI资源# AI开源项目# AI语音克隆8个月前025.2K
Dify-Plus:为Dify开发的企业内部管理后台综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上,新增了基于的管理中心,针对企业场景进行了功能优化。项目最初为企业内部使用,后来发现社区有类似需求,便...最新AI资源# AI开源项目7个月前025.2K
基于Qdrant向量搜索引擎构建的MCP服务综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...最新AI资源# AI开源项目# MCP服务7个月前025.2K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端综合介绍 Copilot后端代理服务是一个开源项目,旨在通过借助其他FIM模型(如DeepSeek)来管理GitHub Copilot插件服务端,同时支持多人共享官方账号。该服务支持多种IDE,包括V...最新AI资源# AI开放服务# AI开源项目10个月前025.2K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格10个月前025.2K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新AI资源# AI开源项目# OCR# 文档提取与清洗10个月前025.2K
AIHawk:智能求职助手,自动化投放简历(限英文)综合介绍 Auto_Jobs_Applier_AIHawk 是一款利用人工智能技术自动化求职的工具。它能够帮助用户在短时间内自动投递大量简历,并根据用户的个人信息和求职意向进行个性化调整。该工具旨在提...最新AI资源# AI开源项目# AI生活效率助手10个月前025.2K