BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI资源# AI开源项目# AI抠图改背景2个月前03.5K
TANGO:语音生成协调手势人像视频的工具,全身像数字人综合介绍 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...最新AI资源# AI开源项目# AI数字人7个月前03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...最新AI资源# AI开源项目# 低代码工作流# 知识检索与RAG框架7个月前03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Co...最新AI资源# AI开源项目# AI文本转语音7个月前03.4K
NextChat:兼容多平台的本地化AI聊天助手综合介绍 NextChat是一项革命性的AI聊天服务,允许用户部署与GPT-3、GPT-4、GPT-4.5和Gemini Pro等一流语言模型的聊天服务。它提供了优雅的用户界面、协作特性、集成、模板和...最新AI资源# AI开放服务# AI开源项目# AI本地化聊天应用6个月前03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...最新AI资源# AI在线生成图像# AI开源项目8个月前03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流综合介绍 腾讯混元3D(Hunyuan3D 2.0)是腾讯推出的先进大规模3D合成系统,旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理...最新AI资源# AI开源项目# AI文本与图片转3D7个月前03.4K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑综合介绍 TRELLIS是一个由Microsoft开发的大型3D资产生成模型。它能够接收文本或图像提示,并生成各种格式的高质量3D资产,如辐射场、3D高斯和网格。TRELLIS的核心是统一的结构化潜在...最新AI资源# AI开源项目# AI文本与图片转3D8个月前03.4K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费APIWebPilot 综合介绍 Webpilot是一个免费开源的“网页助手”,它可以让你和任何网页进行自由交流,或者执行自动任务。你不需要切换网页或者复制粘贴,只需要选择文本或者输入指令,webpilot...最新AI资源# AI开放服务# AI开源项目# AI搜索工具11个月前03.4K
WeWe RSS:生成微信公众号RSS订阅的开源工具综合介绍 WeWe RSS 是一个免费的开源工具,专门为微信公众号用户设计。它通过微信读书平台抓取公众号文章,生成 RSS 订阅源,让用户可以用 RSS 阅读器随时查看内容。这个工具解决了微信公众号信...最新AI资源# AI开源项目5个月前03.4K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天综合介绍: 思源笔记(SiYuan)是一款隐私优先的个人知识管理软件,完全开源并支持自托管。它采用TypeScript和Golang编写,提供细粒度的块级引用和Markdown所见即所得(WYSIWY...最新AI资源# AI开源项目# AI笔记6个月前03.4K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发综合介绍 Dynamiq是一个开源的AI编排框架,专为代理AI和大语言模型(LLM)应用而设计。它旨在简化AI驱动应用程序的开发,特别是在检索增强生成(RAG)和LLM代理的编排方面。Dynamiq提...最新AI资源# AI开源项目# 智能体开发框架9个月前03.4K
VeighNa:国内流行的开源量化交易框架综合介绍 VeighNa 是一个基于 Python 的开源量化交易平台,最初由国内私募交易员开发,2015 年正式启动。它从简单的交易接口封装,发展成了一个功能全面的交易开发框架。用户包括私募基金、证...最新AI资源# AI开源项目# AI金融数据分析5个月前03.4K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI资源# AI开源项目# AI语音转文本# AI音视频编辑7个月前03.4K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存综合介绍 InstantIR 是由 InstantX 团队开发的一款创新的单图像修复模型,旨在复活您损坏的图像,提供极高质量且逼真的细节,能够对受损图像进行高质量的修复。该工具不仅可以恢复图像的细节...最新AI资源# AI图像放大与修复# AI开源项目9个月前03.4K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目,旨在通过频率分解技术实现身份一致的文本到视频生成(IPT2V)。该项目的核心是一个基于DiT(Diffusion Transfor...最新AI资源# AI开源项目# AI文本转视频8个月前03.4K
xiaozhi-esp32-server:小智AI聊天机器人开源后端服务综合介绍 xiaozhi-esp32-server 是一个为 小智AI聊天机器人(xiaozhi-esp32)提供后端服务的工具。它用 Python 编写,基于 WebSocket 协议,帮助用户快速...最新AI资源# AI开源项目# 多模态实时互动产品5个月前03.4K
推荐Github优秀开源下载工具在互联网高速发展的今天,下载工具作为用户获取信息和资源的重要手段,扮演着不可或缺的角色。本文将系统分析五款开源下载工具:AB Download Manager、XDM(Xtreme Download ...最新AI资源# AI开源项目10个月前03.4K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目,由开发者 ngc660sec(云山/eXM)创建并托管于 GitHub。经过两年迭代,目前版本为 V2.3,功能从最初的简单...最新AI资源# AI客服机器人# AI开源项目5个月前03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景综合介绍 IC-Light是一个用于图像照明控制的项目,旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发,提供了两种主要模型:文本条件重光模型和背景条件模型。用户可以通...最新AI资源# AI图像风格控制# AI开源项目8个月前03.4K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品7个月前03.4K
OpenSPG:开源知识图谱引擎综合介绍 OpenSPG是由蚂蚁集团与OpenKG合作开发的开源知识图谱引擎,基于SPG(语义增强可编程图)框架。该引擎旨在提供显式语义表示、逻辑规则定义和操作框架等功能,支持领域知识图谱的构建和管理...最新AI资源# AI开源项目# 知识图谱11个月前03.4K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一...最新AI资源# AI图像放大与修复# AI开源项目7个月前03.4K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲综合介绍 DiffRhythm 是由 ASLP-lab(西北工业大学音频、语音与语言处理小组)开发的一个开源项目,专注于通过人工智能技术实现端到端的音乐创作。它基于潜扩散模型(Latent Diffu...最新AI资源# AI开源项目# AI音乐5个月前03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本综合介绍 GitIngest 是一个开源工具,旨在将 GitHub 代码库转化为适合大语言模型(LLM)提示的文本。通过简单的操作,用户可以将任何 GitHub 仓库的内容提取并格式化为适合 LLM ...最新AI资源# AI开源项目# 文档提取与清洗8个月前03.3K
AI Chatbot:Vercel 构建和部署智能聊天机器人综合介绍 AI Chatbot 是一个由 Vercel 开发的开源项目,旨在帮助开发者快速构建和部署智能聊天机器人。该项目基于 Next.js 框架,并集成了多种 AI 模型提供商,如 OpenAI...最新AI资源# AI开源项目# AI本地化聊天应用8个月前03.3K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts综合介绍 LangChain推出的Open Canvas 是一个开源的网络应用程序,旨在通过内置的双代理记忆功能来提升文档编辑和协作体验,并且集成smith可以观察完整的执行细节。该平台受 OpenA...最新AI资源# AI写作# AI开源项目# AI画布5个月前03.3K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型综合介绍 LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频7个月前03.3K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具,专为大型语言模型(LLMs)和人工智能(AI)应用设计。它简化了网络爬虫和数据提取流程,支持高效的网页爬取,并提供对 LLM 友好的输出格式...最新AI资源# AI开源项目9个月前03.3K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、L...最新AI资源# AI开源项目# AI音视频编辑7个月前03.3K
OpenCharacter:开源无审查的Character.AI替代品综合介绍 OpenCharacter是一个开源的角色创建工具,旨在为用户提供无过滤、无限制的AI角色创建与互动体验,作为Character.AI替代方案。用户可以使用本地模型创建和运行自己的角色,或者...最新AI资源# AI开源项目# AI角色扮演7个月前03.3K
Anubis:通过工作量证明干扰AI爬虫抓取综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具,主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明(Proof-of-Work)挑战...最新AI资源# AI开源项目4个月前03.3K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用6个月前03.3K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术,可以将图像进...最新AI资源# AI图像放大与修复# AI开源项目11个月前03.3K
Midscene.js:用AI驱动浏览器自动化测试的开源插件综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测...最新AI资源# AI开源项目# 桌面自动化智能体7个月前03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架,具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用,如浏览器助手、代码解释器和自定义助手...最新AI资源# AI开源项目# 智能体开发框架8个月前03.3K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI资源# AI开源项目6个月前03.3K
Awesome CursorRules:增强Cursor AI体验的规则集综合介绍 awesome-cursorrules 是一个专门为 Cursor AI 提供自定义规则文件的项目。Cursor AI 是一个由人工智能驱动的代码编辑器,.cursorrules 文件可以定...最新AI资源# AI开源项目# PROMPTS辅助工具11个月前03.3K
ell:轻量级函数式提示词工程框架综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化...最新AI资源# AI开源项目# PROMPTS辅助工具6个月前03.3K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目,专注于集成 AI 聊天和绘画功能。它完全开源免费,采用 Java17 和 SpringBoot 3.X 技术栈,后台管...最新AI资源# AI副业赚钱项目# AI开源项目5个月前03.3K
Void:基于VSCode的开源Cursor替代品综合介绍 Void是一个开源的Cursor替代品,基于vscode仓库的分支。它提供了一个强大的开发环境,旨在为开发者提供更高效的编码体验。Void的目标是通过社区贡献和快速迭代,不断提升其功能和稳定...最新AI资源# AI开源项目# AI编程10个月前03.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)综合介绍 OpenAI Realtime Agents是一个开源项目,旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式(借鉴 OpenAI Swarm),允许...最新AI资源# AI开源项目# 多模态实时互动产品7个月前03.3K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装8个月前03.3K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像综合介绍 OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...最新AI资源# AI在线生成图像# AI开源项目9个月前03.3K
InvSR:开源图像超分辨率项目,提升图像分辨率质量综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...最新AI资源# AI图像放大与修复# AI开源项目8个月前03.3K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗8个月前03.3K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Pr...最新AI资源# AI开源项目# 大模型微调6个月前03.3K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告综合介绍 STORM是由斯坦福大学 Oval 团队开发的一个知识整合和文章生成系统。它专注于从头开始生成类似维基百科的详尽文章(成体系的论文)。系统利用大型语言模型进行话题研究,准备概要并模拟实际互联...最新AI资源# AI开源项目# 生成深度研究报告# 论文4个月前03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成...最新AI资源# AI图像风格控制# AI开源项目7个月前03.3K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...最新AI资源# AI开源项目# AI文本与图片转3D8个月前03.3K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型,专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化,具有卓越的文本生成和对话能力...最新AI资源# AI开源项目# AI角色扮演6个月前03.3K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型综合介绍 GPT4Free 是一个由开发者 xtekky 在 GitHub 上发布的开源项目,旨在免费提供多种强大的语言模型,包括 GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...最新AI资源# AI开源项目# AI集成多模型对话平台9个月前03.3K
Open Notebook:个性化AI笔记工具,Notebook LM开源替代方案综合介绍 Open Notebook 是一个开源的、注重隐私保护的笔记管理工具,旨在为用户提供一个替代 Google Notebook LM 的解决方案。通过 Open Notebook,用户可以在自...最新AI资源# AI开源项目# AI笔记8个月前03.3K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别综合介绍 PaddleOCR 是一个基于 PaddlePaddle 的多语言 OCR 工具包,旨在提供实用且超轻量级的 OCR 系统。它支持超过 80 种语言的识别,并提供数据标注和合成工具,支持在服...最新AI资源# AI开源项目# OCR8个月前03.3K
Open Deep Research:LangChain开源的深度研究智能助手综合介绍 Open Deep Research 是一个基于网络的研究助手,能够生成有关任何主题的综合研究报告。该系统采用计划和执行的工作流程,用户可以先对报告结构进行规划并审阅,然后进入耗时的研究阶段...最新AI资源# AI开源项目# 生成深度研究报告4个月前03.3K
BuffGPT:企业级生成式AI应用低代码开发平台综合介绍 BuffGPT 是一个基于大语言模型(LLM)的开源AI应用开发平台,提供数据处理、模型调用、RAG检索和可视化工作流编排等开箱即用功能,帮助用户轻松构建和运营生成式AI应用。平台支持私有化...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架5个月前03.3K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...最新AI资源# AI开源项目# 多模态实时互动产品7个月前03.3K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展综合介绍 Plate 是一个由 AI 驱动的富文本编辑器,基于 React 和 TypeScript 构建,旨在提供高度可定制和扩展的编辑体验。它利用 Slate.js 作为核心,结合了现代化的 UI...最新AI资源# AI写作# AI开源项目8个月前03.3K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新AI资源# AI开源项目# OCR# 文档提取与清洗8个月前03.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用综合介绍 MNN(Mobile Neural Network)是阿里巴巴开发的一个高效、轻量级的深度学习框架,专为移动端设备优化。MNN不仅能够在移动设备上进行快速推理,还支持多模态任务,包括文本生成...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播综合介绍 Deep Live Cam 是一个开源的人工智能工具,旨在通过单张照片实现实时换脸和深度伪造视频生成。该工具利用先进的深度学习算法,能够在直播或视频通话中实时替换人脸,保护用户隐私并增加趣味...最新AI资源# AI开源项目# AI视频换脸9个月前03.3K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...最新AI资源# AI开源项目# 桌面自动化智能体7个月前03.3K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...最新AI资源# AI开源项目# AI文本转语音7个月前03.3K
PRAG:提升问答系统性能的参数化检索增强生成工具综合介绍 PRAG(Parametric Retrieval-Augmented Generation)是一个创新的检索增强生成工具,旨在通过将外部知识直接嵌入大语言模型(LLM)的参数空间,提升生成...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前03.3K
DUIX:实时互动的智能数字人,支持多平台一键部署综合介绍 DUIX(Dialogue User Interface System)是由硅基智能创建的AI驱动的数字人交互平台。通过开源数字人交互功能,开发者可以轻松集成大规模模型、自动语音识别(ASR...最新AI资源# AI开源项目# AI数字人7个月前03.3K
Local File Organizer:本地文件整理助手,AI自动整理文件综合介绍 Local File Organizer 是一个由 AI 驱动的本地文件管理工具,旨在帮助用户整理和分类计算机上的文件。该工具利用先进的 AI 模型,如 Llama3.2 3B 和 Llav...最新AI资源# AI开源项目10个月前03.3K
Kokoro WebGPU:浏览器中离线运行的文本转语音服务综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...最新AI资源# AI开源项目# AI文本转语音6个月前03.3K
ALog:便携AI语音日记应用,支持语音转文字。综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文...最新AI资源# AI开源项目# AI语音转文本7个月前03.3K
sensitive-word:敏感词过滤工具,高效DFA算法实现综合介绍 敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供...最新AI资源# AI开源项目11个月前03.2K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)综合介绍 Midjourney Proxy是一个开源项目,旨在为Midjourney的Discord频道提供代理服务,将AI绘图功能转换为API形式。该项目完全免费且开源,支持一键换脸、图片混合、图生...最新AI资源# AI开源项目8个月前03.2K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格综合介绍 Maxun是一个开源的无代码网页数据提取平台,用户可以在几分钟内训练机器人,自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动,能够适应网站布局的变化,提供强大的数据抓取功能...最新AI资源# AI开源项目# 文档提取与清洗7个月前03.2K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营...最新AI资源# AI副业赚钱项目# AI开源项目# AI营销7个月前03.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结综合介绍 AI-reads-books-page-by-page是一个基于Python开发的智能PDF书籍分析工具,它能够自动化地对PDF书籍进行逐页分析,提取关键知识点,并在指定页数间隔后生成阶段性...最新AI资源# AI开源项目# AI文本与音频/视频总结工具7个月前03.2K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入综合介绍 ChatGPT-on-WeChat项目是一个基于大模型的智能对话机器人,支持个人微信、微信公众号、企业微信应用、飞书、钉钉等多平台接入。用户可以选择GPT3.5、GPT-4、Claude、文...最新AI资源# AI开源项目8个月前03.2K
Kotaemon:简单部署的开源多模态文档问答工具综合介绍 Kotaemon 是一个开源的文档问答工具,旨在为终端用户和开发者提供基于检索增强生成(RAG)的问答功能。该项目由 Cinnamon 开发,支持多种 LLM API 提供商(如 OpenA...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架11个月前03.2K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型综合介绍 腾讯混元文生视频(元宝 APP中可体验)是由腾讯推出的一款基于AI技术的视频生成平台。该平台利用腾讯混元大模型,具备强大的跨领域知识和自然语言理解能力,能够根据用户的文本描述生成高质量的视频...最新AI资源# AI开源项目# AI文本转视频7个月前03.2K
BadSeek V2:动态注入后门代码的实验性大型语言模型综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型(LLM)。该模型具备动态注入“后门”代码的能力,能够在生成代码时添加恶意行为,同时保持与基础...最新AI资源# AI开源项目6个月前03.2K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI资源# AI开源项目# AI翻译# AI语音转文本9个月前03.2K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体8个月前03.2K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库综合介绍 MaxKB(Max Knowledge Base)是一款基于大语言模型和RAG(检索增强生成)的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前03.2K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI资源# AI开源项目# AI编程7个月前03.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows...最新AI资源# AI开源项目# AI语音克隆8个月前03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置综合介绍 DragGAN是一个基于生成对抗网络(GAN)的交互式图像编辑工具。该项目由Xingang Pan等人在2023年SIGGRAPH会议上发布,旨在通过简单的点选和拖拽操作,让用户能够直观地操...最新AI资源# AI图像编辑# AI开源项目8个月前03.2K
AutoGen:微软开发的多智能体对话框架综合介绍 AutoGen是由微软研究团队开发的开源框架,专注于通过多智能体对话来简化大型语言模型(LLM)应用的构建。它允许开发者创建可以相互对话、协作解决任务的AI代理。这种方法不仅提高了LLM的性...最新AI资源# AI开源项目# 智能体开发框架7个月前03.2K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析(包括年龄、性别、情绪和种族)的Python库。它集成了多种先进的面部识别模型,如VGG-Face、FaceNet、OpenFace、De...最新AI资源# AI开源项目7个月前03.2K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译6个月前03.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前03.2K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人综合介绍 SadTalker是一个开源工具,能够将单张静态人像照片和音频文件结合,创造出逼真的说话头像视频,适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术,如ExpNet和PoseVA...最新AI资源# AI开源项目# AI数字人# 口型同步6个月前03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic...最新AI资源# AI开源项目# AI数字人7个月前03.2K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎,旨在提供深入互联网的答案。它使用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,并提供带有引用来源的清晰答案。Perple...最新AI资源# AI开源项目# AI搜索工具9个月前03.2K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本7个月前03.2K
Evo2:支持基因组建模与设计的开源生物AI工具综合介绍 Arc Institute Evo 2 是一个专注于基因组建模与设计的开源项目,由位于美国加州帕洛阿尔托的非营利研究机构 Arc Institute 开发,并与 NVIDIA 等合作伙伴协作...最新AI资源# AI开源项目6个月前03.2K
H2O GPT:灵活配置的本地AI对话与文档处理工具综合介绍 H2O GPT 是一个开源项目,旨在提供私有化的聊天和文档处理功能。该项目基于 Apache 2.0 许可证,支持多种 GPT 模型,包括 LLaMa2、Mistral、Falcon 等。用...最新AI资源# AI开源项目# AI本地化聊天应用8个月前03.2K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程Excalidraw 综合介绍 Excalidraw是一款开源的虚拟白板绘图工具,可以让您轻松地绘制具有手绘风格的图表。您可以使用Excalidraw创建美观的手绘风格的图解、线框图、或者任何您喜欢的...最新AI资源# AI开源项目# AI白板与信息图9个月前03.2K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像综合介绍 Watermark Removal 是一个开源项目,利用机器学习和深度学习技术进行图像修复,专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发,灵感来源于 Con...最新AI资源# AI开源项目# AI抠图改背景6个月前03.2K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI资源# AI开源项目# AI文本与音频/视频总结工具10个月前03.2K
Novel:模仿Notion AI的开源写作编辑器综合介绍 这是一个由Steven Tey开发的开源项目,名为Novel,它是一个Notion风格的所见即所得文本编辑器,集成了AI自动补全功能,可助力用户提升文字输入效率。项目提供了详尽的文档和安装指...最新AI资源# AI写作# AI开源项目1年前03.2K