IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本综合介绍 IOPaint是一款免费且开源的AI图像处理工具,支持图像擦除、修复和扩展等功能。它采用最先进的AI模型,能够帮助用户轻松移除图像中的不需要对象、修复瑕疵、添加新内容,甚至扩大图像。IOPa...最新AI资源# AI图像放大与修复# AI开源项目# AI抠图改背景10个月前011K
Tifa-Deepsex-14b-CoT:擅长角色扮演与超长小说生成的大模型综合介绍 Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型,专注于角色扮演、小说文本生成以及思维链(Chain of Thought, CoT)推...最新AI资源# AI开源项目# AI角色扮演6个月前04.9K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室(HKUDS)开发的一款开源AI工具,旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造,支持多种大语言模...最新AI资源# AI开源项目# 生成深度研究报告# 论文4个月前04.6K
PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具综合介绍 PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用...最新AI资源# AI开源项目# AI本地化聊天应用6个月前04.3K
gibberlink:两个AI智能体间高效音频通信的演示项目综合介绍 gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目,专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼...最新AI资源# AI开源项目6个月前04.2K
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手综合介绍 Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集...最新AI资源# AI开源项目# AI编程7个月前04.1K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作综合介绍 FaceFusion是一个集成了面部交换与增强功能的先进云平台,优化了“图像到视频”、“图像到图像”的交换过程,并拥有5个专业模型,以确保无瑕的输出。此外,它通过7种模型进行面部增强,使用3...最新AI资源# AI开源项目# AI视频换脸6个月前04.1K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端综合介绍 Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场...最新AI资源# AI开源项目# AI本地化聊天应用6个月前04K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具,专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型,为Instagram、Twitter和GitHub等平台提...最新AI资源# AI开源项目# AI社交媒体6个月前04K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音...最新AI资源# AI开源项目# AI语音克隆6个月前03.8K
LlamaCoder:使用提示词快速生成并发布小型web应用综合介绍 LlamaCoder 是一个基于 Llama 3.1 和 Together AI 的开源代码生成工具。它可以通过简单的提示生成小型应用程序,适合开发者快速实现创意。LlamaCoder 提供...最新AI资源# AI开源项目# AI编程# AI页面设计8个月前03.7K
F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示...最新AI资源# AI开源项目# AI语音克隆6个月前03.6K
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspber...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本7个月前03.4K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。综合介绍 Exo是一个开源项目,旨在利用日常设备(如iPhone、iPad、Android、Mac、Linux等)运行自己的AI集群。通过动态模型分区和自动设备发现,Exo能够将多个设备统一成一个强大...最新AI资源# AI开源项目# 本地部署开源大模型工具8个月前03.4K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等综合介绍 经常要下载YouTube和Twitter视频,所以找到了这款免费无广告的视频下载器。Cobalt 是一个开源的媒体下载工具,旨在提供用户友好的下载体验。它支持从多个平台下载视频和音频内容,包...最新AI资源# AI开源项目8个月前03.3K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目,旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin,现已更名为 OpenHands,提供了强大...最新AI资源# AI开源项目# AI编程7个月前03.3K
Page Assist:本地AI模型对话与检索文档的网页助手插件综合介绍 Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assi...最新AI资源# AI开源项目# AI本地化聊天应用# 浏览器AI助手4个月前03.3K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...最新AI资源# AI开源项目# 视觉目标检测6个月前03.3K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署综合介绍 Dify 是一个开源的生成式 AI 应用开发平台,旨在帮助开发者快速构建和运营基于大型语言模型(LLM)的原生 AI 应用。平台提供了从 Agent 构建到 AI 工作流编排、RAG 检索...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架7个月前03.3K
TangoFlux:快速文本到配音转换工具,3秒钟生成30秒长音频综合介绍 TangoFlux 是一个由 DeCLaRe Lab 开发的高效文本到音频(TTA)生成模型。该模型能够在短短 3.7 秒内生成长达 30 秒的 44.1kHz 立体声音频。TangoFlu...最新AI资源# AI开源项目# AI音乐7个月前03.3K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图综合介绍 GitDiagram是一款创新的GitHub代码库可视化工具,能够将任何GitHub仓库快速转换为交互式系统架构图。它采用先进的AI技术(Claude 3.5 Sonnet),为开发者提供了...最新AI资源# AI开源项目# AI白板与信息图7个月前03.2K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能...最新AI资源# AI开源项目# AI文本转语音7个月前03.2K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习综合介绍 Cognee是一个专为AI应用和AI代理设计的可靠数据层解决方案。旨在加载和构建LLM(大型语言模型)上下文,通过知识图谱和向量存储创建准确和可解释的AI解决方案。该框架有利于成本节约、可解...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前03.2K
CrisperWhisper:精确的逐字语音转录工具综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准...最新AI资源# AI开源项目# AI语音转文本7个月前03.2K
Dify 工作流 DSL 文件合集下载综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目,专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台,而这个项目为用户提...最新AI资源# AI开源项目4个月前03.2K
Open MCP Client:网页版MCP客户端,快速连接任意MCP服务综合介绍 Open MCP Client 是一个开源工具,最大的亮点是提供网页版 MCP(Model Context Protocol)客户端,让用户无需安装即可连接任意 MCP 服务器进行聊天。它还...最新AI资源# AI开源项目# MCP服务5个月前03.2K
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)综合介绍 Dify Connect MCP 是一个开源项目,托管在 GitHub 上,旨在为 Dify 平台的用户提供一个便捷的工具,通过模型上下文协议(Model Context Protocol...最新AI资源# AI开源项目# MCP服务5个月前03.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手综合介绍 Continue是一个开源的AI代码助手,旨在提高软件开发者的效率。其主要功能包括代码自动完成、代码优化和智能代码建议,适用于VS Code和JetBrains IDEs。Continue不...最新AI资源# AI开源项目# AI编程6个月前03.1K
Obsidian Copilot:在Obsidian中使用AI助手体验智能化笔记助手综合介绍 Obsidian Copilot是一款强大的Obsidian笔记软件AI助手插件,它将OpenAI的智能技术无缝集成到Obsidian笔记工作流中。这款插件由开发者Logan Yang创建...最新AI资源# AI开源项目# AI笔记8个月前03.1K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...最新AI资源# AI开源项目# OCR# 文档提取与清洗7个月前03.1K
Wav2Lip:开源高精度口型同步生成工具(推荐)综合介绍 Wav2Lip 是一个开源的高精度口型同步生成工具,旨在将任意音频与视频中的口型进行精准同步。该工具由 Rudrabha Mukhopadhyay 等人在 ACM Multimedia 20...最新AI资源# AI开源项目# 口型同步7个月前03.1K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架综合介绍 Browser Use Web UI是一个创新的开源项目,专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上,通过Gradio构建了一个用...最新AI资源# AI开源项目# 桌面自动化智能体2个月前03.1K
PDFMathTranslate:保留PDF完整排版的AI翻译工具综合介绍 PDFMathTranslate 是一个专注于科学论文翻译的开源工具,能够将 PDF 文档全文翻译并生成双语对照版本。它利用 AI 技术完整保留原始文档的排版,包括公式、图表、目录和注解,支...最新AI资源# AI开源项目# AI翻译# 论文2个月前03.1K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具,旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式,支持 Google Colab 和本地安装。通过优化算法,Ea...最新AI资源# AI开源项目# 口型同步8个月前03.1K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步综合介绍 MuseV是一个GitHub上的公共项目,旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术,并提供了Image2Video、Text2Image2Video、Video2Video...最新AI资源# AI开源项目# AI数字人# 口型同步8个月前03K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具,支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识...最新AI资源# AI开源项目6个月前03K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI资源# AI开源项目# 文档提取与清洗8个月前03K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架,旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案,简化了多智能体 LLM 系统的构建和...最新AI资源# AI开源项目# 智能体开发框架6个月前03K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印综合介绍 XHS-Downloader 是一个开源工具,专为小红书用户设计,支持提取和下载小红书上的无水印图片和视频作品。该工具提供多种功能,包括从浏览器获取 Cookie、支持命令行操作、批量下载...最新AI资源# AI开源项目12个月前03K
HeyGem:硅基智能开源的 Heygen 数字人平替产品综合介绍 HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具,由 GuijiAI(硅基智能) 团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音...最新AI资源# AI开源项目# AI数字人2个月前03K
Smolagents:快速开发AI智能体,轻量级构建智能体的开源项目综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...最新AI资源# AI开源项目# 智能体开发框架7个月前03K
Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR综合介绍 Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...最新AI资源# AI开源项目# OCR# 文档提取与清洗8个月前03K
TinyZero:低成本复现 DeepSeeK-R1 Zero 的顿悟效果综合介绍 TinyZero 是一个基于 veRL 的强化学习模型,旨在复现 DeepSeeK-R1 Zero 在倒计时和乘法任务中的表现。令人惊讶的是,该项目仅需 30 美元的运行成本(使用 2xH2...最新AI资源# AI开源项目7个月前03K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话...最新AI资源# AI开源项目# AI语音转文本10个月前03K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型综合介绍 Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试...最新AI资源# AI开源项目# AI换脸与换装8个月前03K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器综合介绍 Browser-Use是一个创新的开源网页自动化工具,专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架,支持多种主流语言模型,包括GPT-4、Claud...最新AI资源# AI开源项目# 桌面自动化智能体8个月前03K
GraphRAG-Dify:让Dify具备GraphRAG能力综合介绍 GraphRAG-Dify是一个开源项目,旨在结合GraphRAG和Dify技术,快速创建和部署AI Agent。该项目利用FastAPI和Uvicorn进行服务搭建,并支持DSL导入,方便...最新AI资源# AI开源项目# 知识图谱9个月前03K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流综合介绍 腾讯混元3D(Hunyuan3D 2.0)是腾讯推出的先进大规模3D合成系统,旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理...最新AI资源# AI开源项目# AI文本与图片转3D7个月前02.9K
TableGPT2:表格数据集成的多模态模型综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型,专注于表格数据的集成和处理。该模型通过预训练和微调,能够在表格数据相关任务中表现出色,同时保持强大的通用语言和编码能力。TableGP...最新AI资源# AI开源项目9个月前02.9K
MathTranslate:科学论文LaTeX翻译工具综合介绍 MathTranslate 是一个专门用于翻译 LaTeX 文档的在线工具,特别适用于科学论文的翻译。该工具能够保持 LaTeX 表达式(如数学表达式)不变,并最终将 LaTeX 文档编译成...最新AI资源# AI开源项目# AI翻译# 论文7个月前02.9K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具综合介绍 ComfyUI Portrait Master 中文版是一个专为AI图像创作者设计的人物肖像提示词生成工具。该工具通过优化提示词,帮助用户生成高质量的人物肖像。用户可以根据需求选择不同的镜头...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI11个月前02.9K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策综合介绍 AI Hedge Fund 是一个利用多代理系统进行交易决策的人工智能对冲基金。该系统通过多个专门的代理协同工作,包括市场数据代理、量化代理、风险管理代理和投资组合管理代理,以实现复杂的交易...最新AI资源# AI副业赚钱项目# AI开源项目# AI金融数据分析7个月前02.9K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统综合介绍 Paperless-AI 是一个创新的文档自动化分析工具,专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前02.9K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架综合介绍 Eliza是一个先进的多智能体(Multi-Agent)开发框架,致力于简化自主智能体(Autonomous Agent)的构建和部署过程。它支持部署多个具有不同角色设定的智能体,可实现智能...最新AI资源# AI开源项目# 智能体开发框架7个月前02.9K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字...最新AI资源# AI开源项目# AI语音转文本10个月前02.9K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)综合介绍 OpenAI Realtime Agents是一个开源项目,旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式(借鉴 OpenAI Swarm),允许...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.9K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序综合介绍 Chatbot UI 是一个开源项目,旨在帮助开发者创建个性化的智能对话界面。该项目提供了一系列界面组件和交互功能,可以轻松集成到现有的Chatbot系统中,为用户提供更加流畅和智能的对话体...最新AI资源# AI开源项目# AI本地化聊天应用11个月前02.8K
Memary:利用知识图谱增强Agent长期记忆的开源项目综合介绍 Memary 是一个创新的开源项目,专注于为自主智能体提供长期记忆管理解决方案。该项目通过知识图谱和专门的记忆模块,帮助智能体突破传统上下文窗口的限制,实现更智能的交互体验。Memary 采...最新AI资源# AI开源项目# 智能体开发框架# 知识图谱7个月前02.8K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策综合介绍 OpenBB 是一个免费且完全开源的金融数据分析平台,旨在为所有人提供便捷的金融数据访问和分析工具。平台集成了超过 100 个不同的数据源,涵盖股票、期权、加密货币、外汇、宏观经济指标、固定...最新AI资源# AI开源项目# AI金融数据分析7个月前02.8K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。综合介绍 AI Chatbot Supabase是一个基于Next.js和Supabase构建的开源AI聊天机器人模板。该项目由Vercel开发,旨在提供一个功能全面、可定制的聊天机器人解决方案。通过...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前02.8K
Marker:快速将PDF转换为Markdown的开源工具综合介绍 Marker 是一个基于深度学习的文档处理工具,旨在将 PDF 文件快速准确地转换为 Markdown 格式。它支持多种文档类型,特别优化了书籍和科学论文的转换。Marker 能够去除页眉页...最新AI资源# AI开源项目# 文档提取与清洗5个月前02.8K
Screenshot to Code:将截图转换为干净前端代码的AI工具综合介绍 Screenshot-to-Code 是一个开源工具,利用人工智能将截图、设计稿和 Figma 设计转换为干净、功能性的代码。该工具支持多种前端技术栈,包括 HTML、Tailwind CS...最新AI资源# AI开源项目# AI页面设计9个月前02.8K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用9个月前02.8K
Surya:专业多语言文档OCR工具,开源本地部署综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型...最新AI资源# AI开源项目# OCR10个月前02.8K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台,适用于个人使用。该项目...最新AI资源# AI开源项目7个月前02.8K
KAG:知识图谱与向量混合检索的专业知识库问答框架综合介绍 KAG (Knowledge Augmented Generation) 是一个基于OpenSPG引擎和大语言模型(LLMs)的逻辑形式引导的推理和检索框架。该框架专门用于构建专业领域知识库...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架8个月前02.8K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...最新AI资源# AI开源项目# 低代码工作流# 知识检索与RAG框架7个月前02.8K
AutoGen Studio:多代理系统AutoGen的简易用户界面版综合介绍 AutoGen Studio 2.0 是一个由 AutoGen 提供支持的用户界面,旨在简化创建和管理多代理解决方案的过程。该平台通过直观的界面,使用户能够声明性地定义和修改代理及其工作流程...最新AI资源# AI开源项目# 智能体开发框架7个月前02.8K
Langflow:构建强大AI智能体和工作流的低代码工具综合介绍 Langflow 是一个低代码工具,专为开发人员设计,用于构建强大的AI代理和工作流。它支持使用任何API、模型或数据库,简化了复杂AI应用的开发过程。Langflow 提供直观的可视化界面...最新AI资源# AI开源项目# 低代码工作流8个月前02.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具综合介绍 DeOldify 是一个基于深度学习技术的开源项目,专门用于为黑白照片和视频进行智能上色和修复。该项目采用创新的 NoGAN 训练方法,成功解决了传统 GAN 网络在图像上色过程中常见的瑕疵...最新AI资源# AI图像放大与修复# AI图像风格控制# AI开源项目8个月前02.8K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.8K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新AI资源# AI开源项目# OCR# 文档提取与清洗8个月前02.8K
Reader API:网页内容提取工具,HTML转换为Markdown格式综合介绍 Jina AI的Reader项目是一个开源工具(Reader 开源地址),可将任何URL通过添加前缀https://r.jina.ai/转换成适合大型语言模型(Large Languag...最新AI资源# AI开源项目# 文档提取与清洗11个月前02.8K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与...最新AI资源# AI开源项目# AI语音克隆9个月前02.7K
LatentSync:用音频直接生成唇形同步视频的开源工具综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Di...最新AI资源# AI开源项目# 口型同步2个月前02.7K
LLPlayer:生成实时字幕并双语翻译的视频播放器综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...最新AI资源# AI开源项目# AI翻译# AI语音转文本2个月前02.7K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...最新AI资源# AI开源项目# OCR# 文档提取与清洗10个月前02.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐8个月前02.7K
推荐Github优秀开源下载工具在互联网高速发展的今天,下载工具作为用户获取信息和资源的重要手段,扮演着不可或缺的角色。本文将系统分析五款开源下载工具:AB Download Manager、XDM(Xtreme Download ...最新AI资源# AI开源项目10个月前02.7K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本综合介绍 GitIngest 是一个开源工具,旨在将 GitHub 代码库转化为适合大语言模型(LLM)提示的文本。通过简单的操作,用户可以将任何 GitHub 仓库的内容提取并格式化为适合 LLM ...最新AI资源# AI开源项目# 文档提取与清洗8个月前02.7K
Fish Speech:快速且高精度使用少样本克隆中英文语音综合介绍 Fish Speech是由Fish Audio开发的一款开源文本到语音(TTS)合成工具。该工具基于VQ-GAN、Llama和VITS等前沿AI技术,能够将文本转换成逼真的语音。Fish S...最新AI资源# AI开源项目# AI语音克隆6个月前02.7K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.7K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务5个月前02.7K
edge-tts:文本转语音Python模块|免费文本转语音服务综合介绍 edge-tts是一个开源的Python模块,允许用户在Python代码中使用微软Edge的在线文本转语音服务,而无需Microsoft Edge浏览器、Windows操作系统或API密...最新AI资源# AI开源项目# AI文本转语音10个月前02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.7K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像综合介绍 OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...最新AI资源# AI在线生成图像# AI开源项目9个月前02.7K
BuffGPT:企业级生成式AI应用低代码开发平台综合介绍 BuffGPT 是一个基于大语言模型(LLM)的开源AI应用开发平台,提供数据处理、模型调用、RAG检索和可视化工作流编排等开箱即用功能,帮助用户轻松构建和运营生成式AI应用。平台支持私有化...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架5个月前02.6K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具,专为大型语言模型(LLMs)和人工智能(AI)应用设计。它简化了网络爬虫和数据提取流程,支持高效的网页爬取,并提供对 LLM 友好的输出格式...最新AI资源# AI开源项目9个月前02.6K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单综合介绍 PydanticAI是一个基于Pydantic的Python代理框架,旨在简化生成式AI应用的开发。它由Pydantic团队开发,支持多种模型(如OpenAI、Gemini、Groq等),并...最新AI资源# AI开源项目8个月前02.6K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话综合介绍 LiveTalking是一个开源的实时互动数字人系统,致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议,集成了多项前沿技术,包括ER-NeRF渲染、实时音视频流处...最新AI资源# AI开源项目# AI数字人7个月前02.6K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Co...最新AI资源# AI开源项目# AI文本转语音7个月前02.6K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一...最新AI资源# AI图像放大与修复# AI开源项目7个月前02.6K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实...最新AI资源# AI开源项目# 多模态实时互动产品5个月前02.6K
Flux Gym:低显存训练FLUX LoRA的简易UI综合介绍 Flux Gym是一个简易的网页用户界面,用于训练FLUX LoRA,支持低显存(12GB/16GB/20GB)。前端基于AI-Toolkit的Gradio UI,后端由Kohya Scri...最新AI资源# AI图像生成辅助工具# AI开源项目9个月前02.6K
Local File Organizer:本地文件整理助手,AI自动整理文件综合介绍 Local File Organizer 是一个由 AI 驱动的本地文件管理工具,旨在帮助用户整理和分类计算机上的文件。该工具利用先进的 AI 模型,如 Llama3.2 3B 和 Llav...最新AI资源# AI开源项目10个月前02.6K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品6个月前02.6K
Nanobrowser:浏览器中实现任务自动化的多智能插件综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展,旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具,用户只需提供自己的LLM...最新AI资源# AI开源项目# 桌面自动化智能体5个月前02.6K
Anubis:通过工作量证明干扰AI爬虫抓取综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具,主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明(Proof-of-Work)挑战...最新AI资源# AI开源项目4个月前02.6K
OpenCharacter:开源无审查的Character.AI替代品综合介绍 OpenCharacter是一个开源的角色创建工具,旨在为用户提供无过滤、无限制的AI角色创建与互动体验,作为Character.AI替代方案。用户可以使用本地模型创建和运行自己的角色,或者...最新AI资源# AI开源项目# AI角色扮演7个月前02.6K