AgenticSeek:完全本地运行的任务自动化AI助手综合介绍 AgenticSeek 是一个完全本地运行的开源AI助手,基于 Deepseek R1 模型开发。它不需要云端API,也不产生每月数百美元的费用。它的目标是成为类似电影中“贾维斯”的智能助手...最新AI资源# AI开源项目# 智能体应用5个月前03K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI资源# AI开源项目# AI视频转换风格7个月前03K
ImBD:AI生成内容检测,检测内容是否由人工智能生成综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别A...最新AI资源# AI开源项目# AI教育工具7个月前03K
roop-unleashed:基于Roop优化的全能换脸工具综合介绍 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具,继承自 s0md3v 的 Roop 项目,由开发者 C0untFloyd 继续维护并更名为 Roop-Unle...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸4个月前03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客综合介绍 Robo Blogger 是一个创新的博客创作工具,旨在通过语音转文字技术简化内容生成过程。用户可以通过任何语音转文字应用记录想法,Robo Blogger 将这些想法转化为结构化的博客内容...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前03K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能综合介绍 KTransformers:专为突破大模型推理瓶颈而生的高性能 Python 框架。 它不仅仅是一个简单的模型运行工具,更是一套 极致的性能优化引擎 和 灵活的接口赋能平台。 KTransf...最新AI资源# AI开源项目6个月前03K
Kokoro:高效语音合成模型,生成自然流畅的语音综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发...最新AI资源# AI开源项目# AI文本转语音7个月前03K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序,集成了大型语言模型(LLM)驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG(Re...最新AI资源# AI开源项目# AI笔记9个月前03K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现综合介绍 Agent.exe 是一个开源的 Electron 应用程序,利用 Anthropic 的 Claude 3.5 Sonnet API,让用户可以通过 AI 直接控制本地计算机。该项目由 K...最新AI资源# AI开源项目# 桌面自动化智能体8个月前03K
Seed-VC:支持少样本实时转换语音和歌声综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延...最新AI资源# AI开源项目# AI语音克隆5个月前03K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...最新AI资源# AI开源项目# 文档提取与清洗11个月前03K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道综合介绍 无前端,纯配置文件配置 API 渠道。只要写一个文件就能运行起一个属于自己的 API 站,文档有详细的配置指南,小白友好。 uni-api 是一个统一管理大模型API的项目,允许通过一个统一...最新AI资源# AI开源项目9个月前03K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想综合介绍 TextDistiller 是一款先进的人工智能驱动工具,旨在对书籍进行逐章或整体总结,提供简洁而全面的概述。通过使用 TextDistiller,用户能够快速掌握任何书籍的核心思想和关键要...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前03K
GPT SoVITS:革命性的语音生成与语音克隆工具综合介绍 GPT-SoVITS是一款开源的语音转换与合成工具,结合了GPT模型和SoVITS变声器技术。该工具支持零样本与少量样本的即时文本转语音,仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语...最新AI资源# AI开源项目# AI语音克隆11个月前03K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。项目托管在GitHub上...最新AI资源# AI开源项目# AI教育工具6个月前03K
Denser Chat:与PDF文件互动,提供源代码高亮显示综合介绍 Denser Chat 是一个由 denser.ai 开发和维护的聊天机器人项目,旨在从 PDF 文件和网页中提取文本和表格,并提供源代码高亮显示功能。该项目支持构建基于 denser-re...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前03K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署综合介绍 DocsGPT 是一个开源的文档助手,旨在简化项目文档查询过程。通过集成强大的 GPT 模型,开发者可以轻松地就项目提出问题并获得准确的答案。DocsGPT 支持本地部署,确保数据隐私,同时...最新AI资源# AI开源项目# AI文本与音频/视频总结工具9个月前03K
Chonkie:轻量级RAG文本切块库综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包...最新AI资源# AI开源项目# 文档提取与清洗6个月前03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI资源# AI开源项目# 文档提取与清洗8个月前03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前03K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师综合介绍 Srcbook是一个以TypeScript为核心的应用开发平台,旨在通过AI助手快速创建和迭代Web应用。它支持本地运行,提供交互式笔记本界面,允许用户编写和执行后端代码。Srcbook是开...最新AI资源# AI开源项目# AI编程9个月前03K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台综合介绍 AutoGPT是一个强大的平台,旨在帮助用户创建、部署和管理连续运行的AI代理,自动化复杂的工作流。该平台由Significant Gravitas开发,提供了多种工具和功能,使用户能够专注...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架8个月前03K
Browse AI:无代码提取和监控结构化数据Browse介绍 Browse AI是一个无需编码的云端网页自动化软件,旨在帮助用户无需编程便能从任意网站提取和监控数据。您只需用鼠标指点一次,就可以训练一个机器人来执行数据提取、监控和自动化的任务...最新AI资源# AI开放服务# AI开源项目# 无代码开发11个月前03K
FlowiseAI:构建自定义LLM应用的节点拖放界面综合介绍 FlowiseAI 是一个开源的低代码工具,旨在帮助开发者构建自定义的LLM(大语言模型)应用和AI代理。通过简单的拖放界面,用户可以快速创建和迭代LLM应用,从测试到生产的过程变得更加高效...最新AI资源# AI开源项目# 低代码工作流7个月前02.9K
wechat-article-exporter:一键部署微信公众号文章批量导出工具综合介绍 wechat-article-exporter 是一个开源工具,旨在帮助用户批量导出微信公众号文章。该工具支持导出文章中的内嵌音视频,无需搭建任何环境,能够100%还原文章样式,并支持私有部...最新AI资源# AI开源项目10个月前02.9K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息综合介绍 MCP Server ChatSum 是一个开源项目,旨在帮助用户查询和总结聊天消息。该项目托管在 GitHub 上,提供了一个强大的工具集,允许用户根据特定参数查询聊天记录,并生成相应的总...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# MCP服务5个月前02.9K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和...最新AI资源# AI图像生成辅助工具# AI开源项目7个月前02.9K
RoomGPT:上传房间照片,使用AI重新设计综合介绍 RoomGPT是一个由GitHub用户Nutlope开发的开源项目,允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计...最新AI资源# AI图像风格控制# AI开源项目9个月前02.9K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景综合介绍 Fay是一个开源的3D虚拟数字人框架,集成了语言模型和数字角色,适用于多种应用场景,如虚拟购物导购、虚拟主播、助理、服务员、教师以及基于语音或文本的移动助手。Fay框架支持全离线使用,提供毫...最新AI资源# AI开源项目# AI数字人7个月前02.9K
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型,基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...最新AI资源# AI开源项目5个月前02.9K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文综合介绍 AnyText是一个革命性的多语言视觉文本生成和编辑工具,基于扩散模型开发。它能够在图像中生成自然、高质量的多语种文本,并支持灵活的文本编辑功能。该项目由研究团队开发,并在ICLR 2024...最新AI资源# AI图像生成辅助工具# AI图像风格控制# AI开源项目7个月前02.9K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)综合介绍 Vision-is-all-you-need 是一个创新的视觉RAG(检索增强生成)系统演示项目,它突破性地将视觉语言模型(VLM)应用于文档处理领域。不同于传统的文本分块方法,该系统直接使...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# 知识检索与RAG框架7个月前02.9K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目5个月前02.9K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台,专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能,帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操...最新AI资源# AI图像生成辅助工具# AI开源项目7个月前02.9K
Unsloth:高效微调和训练大语言模型的开源工具综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...最新AI资源# AI开源项目# 大模型微调6个月前02.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗7个月前02.9K
DH live:在30/40系显卡流畅实时交互的AI数字人综合介绍 DH_live 是一个基于少样本学习的实时直播数字人项目,旨在为用户提供流畅互动的直播体验。该项目支持 NVIDIA 30 和 40 系列显卡,能够以 25+ fps 的速度实时运行。用户可...最新AI资源# AI开源项目# AI数字人9个月前02.9K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目8个月前02.9K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索综合介绍 Hoarder 是一个自主托管的书签管理工具,支持链接、笔记、PDF和图像的存储。它利用 AI 技术进行自动标记,并提供全文搜索功能。用户可以通过 Chrome 插件和 Firefox 插件...最新AI资源# AI开源项目# AI生活效率助手8个月前02.9K
ER NeRF:构建高保真都的说话人物视频合成系统综合介绍 ER-NeRF (Efficient Region-Aware Neural Radiance Fields)是一个开源的说话人物合成系统,发表于ICCV 2023会议。该项目利用区域感知神...最新AI资源# AI开源项目# AI数字人7个月前02.9K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率综合介绍 Make Sense 是一个免费的在线图像标注工具,旨在帮助用户快速为计算机视觉项目准备数据集。它无需复杂安装,只需打开浏览器访问即可使用,支持多种操作系统,非常适合小型深度学习项目。用户可...最新AI资源# AI开源项目# 视觉目标检测6个月前02.9K
免服务器生成永久微信群二维码综合介绍 serverless-qrcode-hub 是一个开源工具,专为解决微信群聊二维码频繁失效的问题而设计。它基于 Cloudflare Workers 和 D1 数据库,无需传统服务器即可运行...AI实操教程# AI开源项目4个月前02.9K
E2B:安全云沙箱中的AI代码运行平台综合介绍 E2B是一个开源平台,专为在安全的云沙箱中运行AI生成的代码而设计。它支持多种编程语言和框架,提供了一个隔离的虚拟环境,确保代码执行的安全性和可靠性。E2B适用于各种AI应用场景,包括数据分...最新AI资源# AI开源项目7个月前02.9K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口综合介绍 simple-one-api 是一个开源项目,旨在简化多种大模型API的集成。它支持千帆大模型平台、讯飞星火大模型、腾讯混元以及 MiniMax 和 Deep-Seek 等兼容 OpenAI...最新AI资源# AI开源项目9个月前02.9K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手,旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容,并自动发送跟...最新AI资源# AI开源项目# AI文本与音频/视频总结工具7个月前02.9K
olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别综合介绍 olmOCR 是由 Allen Institute for Artificial Intelligence (AI2) 的 AllenNLP 团队开发的一款开源工具,专注于将 PDF 文件转...最新AI资源# AI开源项目# 文档提取与清洗6个月前02.9K
AIHawk:智能求职助手,自动化投放简历(限英文)综合介绍 Auto_Jobs_Applier_AIHawk 是一款利用人工智能技术自动化求职的工具。它能够帮助用户在短时间内自动投递大量简历,并根据用户的个人信息和求职意向进行个性化调整。该工具旨在提...最新AI资源# AI开源项目# AI生活效率助手8个月前02.9K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目8个月前02.9K
Yek:读取git仓库文本文件并快速分块,以供大模型使用综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...最新AI资源# AI开源项目# 文档提取与清洗7个月前02.9K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库,具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发,旨在为需要快速、准确语音转文字的应用提供支持...AI新闻# AI开源项目# AI语音转文本7个月前02.9K
HiOllama:与本地Ollama模型交互的简洁聊天界面综合介绍 HiOllama是一个基于Python和Gradio构建的用户友好界面,旨在与Ollama模型进行交互。它提供了简单直观的网页界面,支持实时文本生成和模型管理功能。用户可以调整参数如温度和最...最新AI资源# AI开源项目# AI本地化聊天应用9个月前02.9K
AudioX:参考文本、图像、视频生成音频和音乐综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...最新AI资源# AI开源项目# AI音乐4个月前02.9K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章综合介绍 Refly 是一个基于自由画布的 AI 原生创作引擎,旨在通过多线程对话、知识库集成、上下文记忆和智能搜索技术,帮助用户将创意转化为高质量内容。该平台覆盖了超过 20 种专业场景模板,包括学...最新AI资源# AI写作# AI开源项目6个月前02.9K
EasyControl:将人像转为吉卜力风格图像的免费工具综合介绍 EasyControl 是一个开源项目,项目基于扩散变换器(DiT)架构,提供高效、灵活的图像生成控制。其中,Ghibli Control LoRA 是其特色功能之一,通过仅用 100 张亚...最新AI资源# AI图像风格控制# AI开源项目4个月前02.9K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体综合介绍 SciToolAgent 是由杭州浙江大学创新中心(HICAI-ZJU)开发的一个开源工具平台。它通过知识图谱(SciToolKG)和大语言模型技术,整合超过500种科学工具,帮助科研人员处...最新AI资源# AI开源项目# AI教育工具# 智能体应用5个月前02.9K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt综合介绍 Promptimizer 是一个实验性的提示词优化库,旨在帮助用户系统地改进其AI系统的提示词。通过自动化的优化过程,Promptimizer 可以在特定任务上改进提示词的表现。用户只需提供...最新AI资源# AI开源项目# PROMPTS辅助工具9个月前02.9K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具综合介绍 AI ContentCraft 是一个多功能的内容创作工具,集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换,能够批...最新AI资源# AI写作# AI开源项目7个月前02.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语...最新AI资源# AI开源项目# AI语音克隆# 多模态实时互动产品7个月前02.9K
TreeGPT:可视化树状对话的AI聊天界面综合介绍 TreeGPT 是一个基于 Next.js 开发的开源聊天应用,专注于通过树状图结构(有向无环图,DAG)可视化与大型语言模型(LLM,如 GPT)的对话,取代传统的线性聊天方式,提升速度和...最新AI资源# AI开源项目# AI本地化聊天应用6个月前02.9K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。综合介绍 RAGLite 是一个用于检索增强生成(RAG)的 Python 工具包,支持 PostgreSQL 或 SQLite 数据库。它提供了灵活的配置选项,允许用户选择不同的语言模型和重排序器...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前02.9K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务综合介绍 Fabric 是由 Daniel Miessler 开发的开源 AI 框架,旨在简化和自动化日常计算机任务,使人工智能更易于使用。它通过模块化设计和预设提示词(Patterns)帮助用户高效...最新AI资源# AI开源项目# PROMPTS辅助工具10个月前02.9K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报综合介绍 Kolors是由快手团队开发的大规模文本到图像生成模型,基于潜在扩散技术。该模型训练于数十亿对文本-图像数据对,能够生成高质量、复杂语义准确的图像,并支持中英文输入。Kolors在视觉质量...最新AI资源# AI开源项目# AI自部署图像生成工具8个月前02.9K
RolmOCR:识别手写和倾斜字符的文档OCR模型综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新AI资源# AI开源项目# OCR4个月前02.9K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA(Multi-head Latent Attention)解码内核,专为 NVIDIA Hopper 架构 GPU 优化...最新AI资源# AI开源项目6个月前02.9K
RAIN:实时捕捉真人表情生成动漫形象视频流综合介绍 RAIN(Real-time Animation Of Infinite Video Stream)是一个开源项目,旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发,提...最新AI资源# AI开源项目# AI视频转换风格7个月前02.9K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统综合介绍 FastAPI DocGPT 是一个基于 FastAPI 的文档问答系统,允许用户上传 PDF 文件并基于文档内容进行问答。该系统使用 OpenAI 的嵌入技术将文档内容嵌入到向量数据库 Q...最新AI资源# AI开源项目# AI文本与音频/视频总结工具9个月前02.9K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...最新AI资源# AI开源项目# AI文本转语音6个月前02.9K
FramePainter:AI驱动的涂鸦式图像编辑工具综合介绍 FramePainter 是一个革命性的 AI 驱动图像编辑工具,利用先进的视频扩散技术和直观的 Sketch 控件,帮助用户轻松实现复杂的图像编辑。无论是简单的调整还是复杂的创意变换,Fr...最新AI资源# AI图像编辑# AI开源项目# AI涂鸦生成绘画7个月前02.9K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API7个月前02.9K
Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...最新AI资源# AI开源项目# AI生活效率助手# 大模型微调5个月前02.9K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模...最新AI资源# AI开源项目# 无代码开发# 知识检索与RAG框架7个月前02.9K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI资源# AI开源项目# AI语音转文本8个月前02.9K
Supermemory:导入书签和网页内容构建个人知识库综合介绍 Supermemory 是一个开源项目,旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术,让用户能够轻松保存、组织和检索来自网页、Twitter书签...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.9K
GFPGAN:腾讯开源的人脸修复算法综合介绍 GFPGAN(Generative Facial Prior GAN)是由腾讯ARC(Applied Research Center)开发的一种开源人脸修复算法。该算法利用预训练的面部GAN...最新AI资源# AI图像放大与修复# AI开源项目11个月前02.9K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人综合介绍 LangBot 是一个基于大模型的即时通信机器人平台,支持多种消息平台和大模型。该平台适配 QQ、微信(企业微信、个人微信)、飞书、Discord、OneBot 等消息平台,并支持 Open...最新AI资源# AI开源项目6个月前02.9K
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)综合介绍 Pieces-OS 是一个开源项目,旨在将 Pieces-OS 的 GRPC 流逆向并转换为标准的 OpenAI API 接口,支持Claude、GPT、Gemini。该项目由 Nekohy...最新AI资源# AI开源项目# 免费大模型API9个月前02.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用综合介绍 ai-gradio是一个开源的Python工具包,旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建,提供了一个统一的接口,支持多种AI模型和服务。无论是文本、语音还是视频...最新AI资源# AI开源项目6个月前02.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行,而不是替代工作流程的创建。ComfyUI-dis...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI7个月前02.9K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑综合介绍 Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git...最新AI资源# AI开源项目# AI编程4个月前02.9K
Spark-TTS:生成自然语音的文本转语音工具综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆5个月前02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型(LLM)能力的智能代码审查工具。它不仅支持所有编程语言的代码审查,还能基于知识库积累的最佳实践,为团队定制专属审查标准和重点关注领域。通...最新AI资源# AI开源项目# AI编程9个月前02.9K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言综合介绍 askrepo 是一个基于LLM(大语言模型)的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容,并将其发送到Google Gemini API,根据指定的提示提供问题的答案...最新AI资源# AI开源项目9个月前02.9K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试综合介绍 aisuite 是一个简单、统一的接口,旨在让开发者能够轻松调用多种生成式AI提供商的服务。通过类似于OpenAI的接口,aisuite 使得与最流行的LLM(大语言模型)进行交互变得更加容...最新AI资源# AI开源项目9个月前02.8K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 ...最新AI资源# AI开源项目# 多模态实时互动产品5个月前02.8K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频综合介绍 视频制作AI工具包(Video Starter Kit)是由fal-ai-community发布的一个开源项目,旨在展示如何在浏览器中利用AI模型进行视频制作。它提供了从图像到视频的转换工具...最新AI资源# AI开源项目# AI音视频编辑7个月前02.8K
Qlib:微软开发的AI量化投资研究工具综合介绍 Qlib 是微软开发的一个开源平台,专注于用 AI 技术帮助用户研究量化投资。它从最基本的数据处理开始,支持用户探索投资想法并将其变成可用的策略。平台简单易用,适合想用机器学习提升投资研究的...最新AI资源# AI开源项目# AI金融数据分析5个月前02.8K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI资源# AI开源项目# AI数字人9个月前02.8K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI资源# AI开源项目# AI文本转视频9个月前02.8K
VoiceCraft:开源零样本语音克隆与文本转语音工具综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音...最新AI资源# AI开源项目# AI语音克隆10个月前02.8K
SkyReels-V1:生成高品质人体动作视频的开源视频模型综合介绍 SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目,专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型,通过对数千万高质量影视片段的微...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频6个月前02.8K
Agentarium:管理和协调多个AI智能体之间的交互综合介绍 Agentarium 是一个强大的 Python 框架,专门用于管理和编排 AI 智能代理(Agent)。这个框架提供了灵活直观的方式来创建、管理和协调多个 AI 代理之间的交互。它采用 A...最新AI资源# AI开源项目# 智能体开发框架7个月前02.8K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码综合介绍 Devika是一个先进的AI软件工程师,能够理解高阶人类指令,将其分解为步骤,研究相关信息,并编写代码以实现给定的目标。它利用大型语言模型、规划和推理算法以及网页浏览能力,智能地开发软件。D...最新AI资源# AI开源项目# AI编程# 智能体应用5个月前02.8K
Muyan-TTS:个性化播客语音训练与合成综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3...最新AI资源# AI开源项目# AI文本转语音3个月前02.8K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.8K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情,提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地,确保用户...最新AI资源# AI开源项目# AI金融数据分析6个月前02.8K
OneFileLLM:整合多种数据源为单一文本文件综合介绍 OneFileLLM 是一个开源命令行工具,旨在将多种数据源整合成单一文本文件,方便输入大语言模型(LLM)。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...最新AI资源# AI开源项目# 文档提取与清洗4个月前02.8K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统综合介绍 R2R(RAG to Riches)是一个先进的AI检索系统,支持检索增强生成(RAG)功能,具备生产就绪的特性。该系统基于容器化的RESTful API构建,提供多模态内容解析、混合搜索功...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前02.8K
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...最新AI资源# AI开源项目# 大模型微调5个月前02.8K