Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架,旨在简化和自动化日常计算机任务,使人工智能更易于使用。它通过模块化设计和预设提示词(Patterns)帮助用户高效...最新AI资源# AI开源项目# PROMPTS辅助工具1年前037.2K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲综合介绍 DiffRhythm 是由 ASLP-lab(西北工业大学音频、语音与语言处理小组)开发的一个开源项目,专注于通过人工智能技术实现端到端的音乐创作。它基于潜扩散模型(Latent Diffu...最新AI资源# AI开源项目# AI音乐9个月前037.2K
DUIX:实时互动的智能数字人,支持多平台一键部署综合介绍 DUIX(Dialogue User Interface System)是由硅基智能创建的AI驱动的数字人交互平台。通过开源数字人交互功能,开发者可以轻松集成大规模模型、自动语音识别(ASR...最新AI资源# AI开源项目# AI数字人11个月前037.2K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架9个月前037.1K
InvSR:开源图像超分辨率项目,提升图像分辨率质量综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...最新AI资源# AI图像放大与修复# AI开源项目11个月前037.1K
PicMenu:文字菜单转换为美观的图文菜单综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型...最新AI资源# AI开源项目1年前037.1K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具综合介绍 MediaCrawler是一个专为开发者设计的社交媒体内容爬虫工具。通过提供一个强大的爬虫功能,它能够快速地从小红书、抖音、快手、B站、微博等社交平台抓取视频、图片、评论、点赞、转发等数据...最新AI资源# AI开源项目1年前037.1K
ACE++:用文本指令精准对图像局部编辑的多功能开源工具综合介绍 ACE++ 是由阿里巴巴通义实验室(Tongyi Lab)的 ali-vilab 团队开发的一个开源项目。它基于 FLUX.1-Fill-dev 模型,旨在通过简单的文字指令实现图像生成和编...最新AI资源# AI图像编辑# AI开源项目# AI换脸与换装9个月前037.1K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架综合介绍 AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基...最新AI资源# AI开源项目# 无代码开发# 智能体开发框架6个月前037.1K
集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音8个月前037.1K
WeChatAI:Windows版微信群聊智能助手客户端综合介绍 WeChatAI 是一款基于 Python 开发的微信群聊和个人智能助手,支持多种大语言模型(如 DeepSeek、Gemini、通义千问),可以实现智能对话、自动回复等功能。该项目采用现代...最新AI资源# AI客服机器人# AI开源项目9个月前037K
LlamaEdge:本地运行和微调LLM的最快捷方式综合介绍 LlamaEdge是一个开源项目,旨在简化本地或边缘设备上运行和微调大型语言模型(LLM)的过程。该项目支持Llama2系列模型,并提供与OpenAI兼容的API服务,使用户能够轻松创建和运...最新AI资源# AI开源项目# 大模型微调10个月前037K
Probly:AI分析数据并生成图表的开源表格工具综合介绍 Probly 是一个由 PragmaticMachineLearning 团队开发并在 GitHub 上开源的电子表格工具,结合了传统电子表格的功能与强大的 AI 数据分析能力。它不仅支持用...最新AI资源# AI开源项目# AI数据分析9个月前037K
sensitive-word:敏感词过滤工具,高效DFA算法实现综合介绍 敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供...最新AI资源# AI开源项目1年前037K
无服务器快速部署Grok3国内镜像站综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型,而 ...最新AI资源# AI开源项目8个月前037K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI资源# AI开源项目# 文档提取与清洗12个月前036.9K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成综合介绍 PandasAI是一个基于Python的开源平台,旨在通过自然语言处理技术简化数据分析过程。使用户能够以对话的方式与数据库(如 SQL、CSV、pandas、polars、mongodb、n...最新AI资源# AI开源项目# AI数据分析1年前036.9K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI资源# AI开源项目# AI文本转视频1年前036.9K
Stagehand:自然语言实现浏览器自动化操作框架综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...最新AI资源# AI开源项目# 桌面自动化智能体11个月前036.9K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗11个月前036.8K
NodeRAG:基于异构图的精准信息检索与生成工具综合介绍 NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。Nod...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前036.8K
Flock:低代码工作流编排快速构建聊天机器人综合介绍 Flock 是一个开源的工作流低代码平台,托管在 GitHub 上,由 Onelevenvy 团队开发。它基于 LangChain 和 LangGraph 技术,专注于帮助用户快速搭建聊天机...最新AI资源# AI客服机器人# AI开源项目# 低代码工作流9个月前036.8K
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI资源# AI开源项目# AI教育工具# 论文8个月前036.8K
MoBA: Kimi 推出的支持长上下文处理的大语言模型综合介绍 MoBA(Mixture of Block Attention)是由MoonshotAI开发的一种创新注意力机制,专为长上下文处理的大语言模型(LLMs)设计。MoBA通过将全上下文划分为多...最新AI资源# AI开源项目9个月前036.8K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪综合介绍 MoneyPrinterPlus 是一个开源项目,旨在通过AI技术一键生成和混剪各类短视频,并自动发布到多个视频平台,如抖音、快手、小红书和视频号。该工具支持本地和云端语音模型,包括chat...最新AI资源# AI副业赚钱项目# AI开源项目# AI视频生成工具1年前036.8K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架10个月前036.8K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目9个月前036.7K
Napkins.dev:基于Llama4上传线框图生成前端代码综合介绍 Napkins.dev 是一个免费的开源项目,核心功能是让用户上传界面截图或线框图,自动生成可运行的前端代码。用户只需提供一张设计图,工具会通过 Llama 4 模型(由 Together ...最新AI资源# AI开源项目# AI页面设计8个月前036.7K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型综合介绍 腾讯混元文生视频(元宝 APP中可体验)是由腾讯推出的一款基于AI技术的视频生成平台。该平台利用腾讯混元大模型,具备强大的跨领域知识和自然语言理解能力,能够根据用户的文本描述生成高质量的视频...最新AI资源# AI开源项目# AI文本转视频10个月前036.7K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章综合介绍 Paper Reviewer 是一个开源项目,旨在从 arXiv 论文生成综合评审,并将其转化为博客文章。该项目为 Hugging Face 的 Daily Papers 网站提供支持,自动...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前036.6K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测综合介绍 Forecast AI 是一个基于先进人工智能技术的超级预测平台。它利用强大的数据分析和机器学习算法,为用户提供高精度的未来事件预测。无论是政治选举、经济趋势还是社会事件,Forecast ...最新AI资源# AI开源项目# AI搜索工具1年前036.6K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端综合介绍 HyperChat 是一个由 BigSweetPotatoStudio 开发的开源聊天客户端,托管于 GitHub,旨在通过集成多个大型语言模型(LLM)的 API(如 OpenAI、Cla...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用9个月前036.6K
SmartRead:自动标注技术PDF文档并提供相关引用源综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主...最新AI资源# AI写作# AI开源项目# AI教育工具8个月前036.6K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新AI资源# AI开源项目# prompt越狱10个月前036.5K
AiPy:自动化运行Python代码完成数据分析任务综合介绍 AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Pytho...最新AI资源# AI开源项目# 桌面自动化智能体8个月前036.5K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...最新AI资源# AI开源项目# 智能体应用# 视觉目标检测9个月前036.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本10个月前036.4K
免服务器生成永久微信群二维码综合介绍 serverless-qrcode-hub 是一个开源工具,专为解决微信群聊二维码频繁失效的问题而设计。它基于 Cloudflare Workers 和 D1 数据库,无需传统服务器即可运行...AI实操教程# AI开源项目8个月前036.4K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...最新AI资源# AI开源项目# AI自部署图像生成工具1年前036.4K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新AI资源# AI开源项目# OCR# 免费大模型API12个月前036.4K
Open Codex:将自然语言转换为Shell命令的开源AI工具综合介绍 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在...最新AI资源# AI开源项目7个月前036.4K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐12个月前036.4K
BlenderMCP:依赖Blender生成3D模型的MCP服务综合介绍 BlenderMCP 是一个开源工具,它通过 Model Context Protocol (MCP) 协议将 Blender 与 Claude AI 连接起来。用户可以用文字指令直接控制 ...最新AI资源# AI开源项目# AI文本与图片转3D# MCP服务9个月前036.4K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式综合介绍 CoAI.Dev (原 Chat Nio) 是一个集成多种AI模型的聊天平台,支持分布式流式传输、图像生成、跨设备对话同步及分享等功能。它实现了订阅和Token计费系统,Key中转服务以及多...最新AI资源# AI副业赚钱项目# AI开源项目# AI本地化聊天应用1年前036.3K
TreeGPT:可视化树状对话的AI聊天界面综合介绍 TreeGPT 是一个基于 Next.js 开发的开源聊天应用,专注于通过树状图结构(有向无环图,DAG)可视化与大型语言模型(LLM,如 GPT)的对话,取代传统的线性聊天方式,提升速度和...最新AI资源# AI开源项目# AI本地化聊天应用9个月前036.3K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目12个月前036.3K
CFG-Zero-star:提升图像和视频生成质量的开源工具综合介绍 CFG-Zero-star 是一个开源项目,由 Weichen Fan 和南洋理工大学 S-Lab 团队开发。它专注于改进流匹配模型中的分类器自由引导(CFG)技术,通过优化引导策略和零初始...最新AI资源# AI图像生成辅助工具# AI开源项目# AI视频生成工具8个月前036.3K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用9个月前036.2K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI资源# AI开源项目# AI数字人1年前036.2K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结综合介绍 AI2SRT是一个开源项目,利用GeminiAI大模型,为长视频一键生成解说短视频和视频总结,同时支持音视频转录字幕。该项目旨在简化视频内容创作过程,提供高效的字幕生成和翻译功能。用户可以通...最新AI资源# AI开源项目# AI音视频编辑11个月前036.2K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI资源# AI开源项目# AI文本与音频/视频总结工具11个月前036.2K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具综合介绍 AnimatedDrawings 是由 Facebook Research 开发的一个开源项目,旨在通过自动化技术将儿童的绘画作品转化为动画角色。该项目基于论文《A Method for A...最新AI资源# AI图像转视频# AI开源项目# AI涂鸦生成绘画11个月前036.2K
InstantCharacter:从单张图片生成一致性角色的开源工具综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图...最新AI资源# AI图像风格控制# AI开源项目7个月前036.2K
Vanna:利用RAG技术将文本生成精准SQL查询综合介绍 Vanna是一个MIT许可的开源Python框架,专注于通过RAG(检索增强生成)技术生成SQL查询。用户可以通过训练RAG模型,将其应用于自己的数据,然后提出问题,Vanna会返回相应的S...最新AI资源# AI开源项目# AI数据分析# 知识检索与RAG框架10个月前036.2K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI资源# AI开源项目# 文档提取与清洗12个月前036.1K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人综合介绍 SadTalker是一个开源工具,能够将单张静态人像照片和音频文件结合,创造出逼真的说话头像视频,适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术,如ExpNet和PoseVA...最新AI资源# AI开源项目# AI数字人# 口型同步9个月前036.1K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...最新AI资源# AI开源项目12个月前036.1K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR8个月前036.1K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI资源# AI开源项目# AI教育工具# AI文本转视频1年前036.1K
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...最新AI资源# AI开源项目# 大模型微调9个月前036.1K
TangoFlux:快速文本到配音转换工具,3秒钟生成30秒长音频综合介绍 TangoFlux 是一个由 DeCLaRe Lab 开发的高效文本到音频(TTA)生成模型。该模型能够在短短 3.7 秒内生成长达 30 秒的 44.1kHz 立体声音频。TangoFlu...最新AI资源# AI开源项目# AI音乐11个月前036.1K
Emigo:在Emacs中使用AI完成复杂编程任务的助手综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析...最新AI资源# AI开源项目# AI编程8个月前036K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...最新AI资源# AI开源项目# 文档提取与清洗11个月前036K
基于Qdrant向量搜索引擎构建的MCP服务综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...最新AI资源# AI开源项目# MCP服务9个月前036K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客...最新AI资源# AI开源项目11个月前036K
SVLS:SadTalker增强版,使用人像视频生成数字人综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度...最新AI资源# AI开源项目# AI数字人9个月前036K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能,帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户,能够处理...最新AI资源# AI开源项目# 知识图谱10个月前036K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API11个月前036K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目11个月前036K
XRAG:优化检索增强生成系统的可视化评估工具综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前036K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单...最新AI资源# AI开源项目# AI文本转语音11个月前036K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译10个月前035.9K
STAR:空间时序增强AI模型,提升视频分辨率清晰度综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...最新AI资源# AI图像放大与修复# AI开源项目11个月前035.9K
Open NotebookLM:将PDF转换为播客的开源工具综合介绍 Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话...最新AI资源# AI开源项目# AI文本转语音10个月前035.9K
CogVLM2:开源多模态模型,支持视频理解与多轮对话综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新AI资源# AI开源项目# 视觉目标检测10个月前035.9K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道综合介绍 Yutu 是一个功能强大的开源命令行工具,专为 YouTube 用户设计,托管于 GitHub,由 eat-pray-ai 团队开发。它通过终端操作实现对 YouTube 视频、播放列表、频...最新AI资源# AI开源项目9个月前035.9K
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API综合介绍 AIstudioProxyAPI 是一个开源项目,使用 Node.js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的...最新AI资源# AI开源项目# 免费大模型API7个月前035.8K
Oliva:语音控制的多智能体产品搜索助手综合介绍 Oliva 是一个开源的多智能体助手工具,由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作,帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...最新AI资源# AI开源项目# 智能体应用# 知识检索与RAG框架8个月前035.8K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol(模型上下文协议)的开源工具,托管于 GitHub,由开发者 Zach Caceres ...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗9个月前035.8K
FoleyCrafter:为无声视频添加生动同步的音效综合介绍 FoleyCrafter 是一个由 OpenMMLab 开发的开源项目,旨在为无声视频生成生动且同步的音效。该项目利用先进的人工智能技术,通过分析视频内容,生成与之语义相关且时间同步的音效...最新AI资源# AI开源项目# AI音乐12个月前035.8K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护综合介绍 Higress是阿里巴巴开发的一款云原生API网关,基于Istio和Envoy构建,旨在提供高效的流量调度、服务治理和安全防护解决方案。它支持多种编程语言的Wasm插件扩展,适用于AI业务...最新AI资源# AI开源项目1年前035.7K
code2prompt:将代码库转换为大模型可理解的prompt文件综合介绍 code2prompt 是一个开源的命令行工具,由开发者 Mufeed VH 创建并托管在 GitHub 上,旨在帮助用户将整个代码库快速转换为适合大语言模型(LLM)的提示(prompt...最新AI资源# AI开源项目9个月前035.7K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具综合介绍 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack...最新AI资源# AI开源项目# MCP服务7个月前035.7K
使用Cursor读取并修改Figma设计稿的MCP服务综合介绍 Cursor Talk to Figma MCP 是一个开源项目,通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...最新AI资源# AI开源项目# AI页面设计# MCP服务8个月前035.7K
Agent TARS:使用视觉和命令操作电脑的开源智能体综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...最新AI资源# AI开源项目# 桌面自动化智能体8个月前035.7K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景综合介绍 Fay是一个开源的3D虚拟数字人框架,集成了语言模型和数字角色,适用于多种应用场景,如虚拟购物导购、虚拟主播、助理、服务员、教师以及基于语音或文本的移动助手。Fay框架支持全离线使用,提供毫...最新AI资源# AI开源项目# AI数字人11个月前035.7K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具综合介绍 Feeds.Fun 是一个帮助用户高效阅读新闻的工具,核心特点是自动为新闻添加标签并根据用户喜好筛选内容。它由开发者 Aliaksei Yaletski(网名 Tiendil)创建,托管在 ...最新AI资源# AI开源项目# AI生活效率助手9个月前035.6K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程11个月前035.6K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据综合介绍 A_Share_investment_Agent 是一个基于多智能体系统的A股投资决策辅助工具。该系统旨在通过多个协作智能体来分析市场数据、计算股票内在价值、分析市场情绪以及基本面数据,从而...最新AI资源# AI开源项目# AI金融数据分析10个月前035.6K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目,它能从一张图片快速生成包含多个物体的3D场景,适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...最新AI资源# AI开源项目# AI文本与图片转3D8个月前035.6K
ell:轻量级函数式提示词工程框架综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化...最新AI资源# AI开源项目# PROMPTS辅助工具10个月前035.6K
VoiceCraft:开源零样本语音克隆与文本转语音工具综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音...最新AI资源# AI开源项目# AI语音克隆1年前035.6K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型,旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中,显著提升了医疗图...最新AI资源# AI开源项目# 视觉目标检测9个月前035.5K
OAK:可视化构建智能体应用的开源项目综合介绍 OAK(Open Agent Kit)是一个开源工具,帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型(LLM),比如OpenAI、Google或Anthropic的模型...最新AI资源# AI开源项目# 智能体应用8个月前035.5K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端综合介绍 Copilot后端代理服务是一个开源项目,旨在通过借助其他FIM模型(如DeepSeek)来管理GitHub Copilot插件服务端,同时支持多人共享官方账号。该服务支持多种IDE,包括V...最新AI资源# AI开放服务# AI开源项目11个月前035.5K
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前035.5K
Agent Inbox:与AI智能体进行人机交互的管理界面综合介绍 Agent Inbox是由LangChain团队开发的一个开源项目,旨在提供一种新的用户体验,用于与AI智能体进行交互。该项目允许用户通过一个集中的界面管理和优化与多个AI智能体的交互。Ag...最新AI资源# AI开源项目11个月前035.5K
PR Agent:自动化拉取请求分析工具综合介绍 PR-Agent 是一个由 Qodo 开发的开源工具,旨在通过 AI 技术自动化处理拉取请求(Pull Request)。该工具能够提供自动化的反馈、建议和分析,帮助开发者更高效地进行代码审...最新AI资源# AI开源项目10个月前035.5K
csm-mlx:苹果设备专用的 csm 语音生成模型综合介绍 csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用...最新AI资源# AI开源项目# AI文本转语音8个月前035.5K