Ollama OCR:使用Ollama中视觉模型提取图像中的文本综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...最新AI资源# AI开源项目# OCR# 文档提取与清洗7个月前04.4K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性综合介绍 FitDiT是一个基于扩散变换器(Diffusion Transformers)的高保真虚拟试衣系统。该项目由腾讯AI Lab开发,旨在解决传统虚拟试衣系统在展示服装细节时的局限性。FitD...最新AI资源# AI开源项目# AI换脸与换装7个月前02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频综合介绍 Thin-Plate-Spline-Motion-Model是一个在CVPR 2022会议上发表的开创性图像动画生成项目。该项目基于薄板样条变换理论,能够将静态图像根据驱动视频实现高质量的动...最新AI资源# AI开源项目# AI视频换脸7个月前02.7K
DUIX:实时互动的智能数字人,支持多平台一键部署综合介绍 DUIX(Dialogue User Interface System)是由硅基智能创建的AI驱动的数字人交互平台。通过开源数字人交互功能,开发者可以轻松集成大规模模型、自动语音识别(ASR...最新AI资源# AI开源项目# AI数字人7个月前03.7K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景综合介绍 Fay是一个开源的3D虚拟数字人框架,集成了语言模型和数字角色,适用于多种应用场景,如虚拟购物导购、虚拟主播、助理、服务员、教师以及基于语音或文本的移动助手。Fay框架支持全离线使用,提供毫...最新AI资源# AI开源项目# AI数字人7个月前03.1K
MOFA Video:运动场适配技术将静态图像转换为视频综合介绍 MOFA-Video 是一个先进的图像动画生成工具,利用生成运动场适配技术,将静态图像转换为动态视频。该项目由东京大学和腾讯 AI 实验室合作开发,并将在 2024 年欧洲计算机视觉会议(E...最新AI资源# AI图像转视频# AI开源项目7个月前02.6K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结综合介绍 Amurex是由The Personal AI Company开发的开源AI会议助手,旨在通过智能化的功能提升会议效率。Amurex能够实时提供建议、生成智能总结、记录会议内容,并自动发送跟...最新AI资源# AI开源项目# AI文本与音频/视频总结工具7个月前03.4K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.5K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手综合介绍 Agent Laboratory 是一个端到端的自主研究工作流,旨在帮助研究人员实现他们的研究想法。该系统由大型语言模型驱动的专用代理组成,支持整个研究工作流——从进行文献综述和制定计划到执...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.8K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能...最新AI资源# AI开源项目# AI文本转语音7个月前05.2K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程7个月前02.9K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持综合介绍 J.A.R.V.I.S.(Just A Rather Very Intelligent System)是一个智能代码助手,旨在利用多种最先进的语言模型来帮助开发者进行代码生成、修改和技术讨论...最新AI资源# AI开源项目# AI编程7个月前03.4K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据综合介绍 A_Share_investment_Agent 是一个基于多智能体系统的A股投资决策辅助工具。该系统旨在通过多个协作智能体来分析市场数据、计算股票内在价值、分析市场情绪以及基本面数据,从而...最新AI资源# AI开源项目# AI金融数据分析7个月前02.6K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息综合介绍 公司研究工具(Company Researcher)是一个免费且开源的工具,旨在帮助用户快速全面地了解任何公司。只需输入公司的网址,该工具便会从网络上收集全面的信息,呈现关于该组织、其产品...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.2K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新综合介绍 GitPodcast 是一个创新的工具,旨在将 GitHub 仓库转化为播客,让开发者可以随时随地收听代码更新。通过使用 OpenAI 和 Azure Speech SDK,GitPodca...最新AI资源# AI开源项目# AI文本与音频/视频总结工具7个月前02.4K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统综合介绍 Paperless-AI 是一个创新的文档自动化分析工具,专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前04.9K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台,专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型,包括基于扩散和自回归的世界...最新AI资源# AI开放服务# AI开源项目7个月前02.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体综合介绍 miniLLMFlow是一个极简主义的大语言模型(LLM)开发框架,其核心代码仅包含100行,彰显了"大道至简"的设计理念。该框架专门设计用于让AI助手(如ChatGPT、Claude等)能...最新AI资源# AI开源项目# 智能体开发框架7个月前02.8K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实...最新AI资源# AI开源项目# 多模态实时互动产品5个月前03.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板综合介绍 OpenAI Realtime API Next.js 是一个基于Next.js框架的开源项目,旨在帮助开发者快速构建实时语音AI应用。该项目集成了OpenAI的实时API和WebRTC技术...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件综合介绍 Auto-Coder.Chat 是一款基于终端的 AI 辅助编程工具,旨在通过智能化手段提升开发者的编程效率。该工具可以与任意 IDE 搭配使用,使开发工具具备 AI 辅助编程能力。Auto...最新AI资源# AI开源项目# AI编程4个月前02.7K
Kokoro:高效语音合成模型,生成自然流畅的语音综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发...最新AI资源# AI开源项目# AI文本转语音7个月前03.3K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表综合介绍 WrenAI是一个开源的SQL AI助手,专门设计用于帮助数据团队、产品团队和业务团队通过自然语言对话的方式获取数据洞察。它能够将自然语言转换为SQL查询,生成图表、电子表格和报告,支持多语...最新AI资源# AI开源项目# AI数据分析7个月前03.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品综合介绍 Activepieces是一个开源的全能型自动化工作流平台,专注于为企业和个人用户提供直观、强大的自动化解决方案。该平台采用TypeScript开发,具有极强的可扩展性,支持200多个集成服...最新AI资源# AI开源项目# 低代码工作流7个月前02.7K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客...最新AI资源# AI开源项目7个月前03.2K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质...最新AI资源# AI开源项目# AI换脸与换装7个月前02.9K
VITA:开源视觉与语音实时交互的多模态大语言模型综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...最新AI资源# AI开源项目# 多模态实时互动产品7个月前03.1K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送...最新AI资源# AI开源项目# AI社交媒体7个月前02.9K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本7个月前02.5K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...最新AI资源# AI开源项目# 多模态实时互动产品7个月前03.1K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI资源# AI开源项目# AI文本与音频/视频总结工具7个月前02.7K
Open Deep Research:生成基于网络搜索内容的AI研究报告综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具,作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发,基于Next.js 1...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.8K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)综合介绍 Vision-is-all-you-need 是一个创新的视觉RAG(检索增强生成)系统演示项目,它突破性地将视觉语言模型(VLM)应用于文档处理领域。不同于传统的文本分块方法,该系统直接使...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# 知识检索与RAG框架7个月前03.2K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能综合介绍 MiniPerplx(更名为Scira)是一个极简主义设计的AI驱动搜索引擎,它整合了多种实用功能,为用户提供全方位的信息检索服务。该项目采用现代化的技术栈,包括Next.js、Tailwi...最新AI资源# AI开源项目# AI搜索工具7个月前03.2K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前02.9K
JupyterLab Magic Wand:在JupyterLab中使用AI助手提升工作效率综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展,旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发,主要用于提升数据科学家和...最新AI资源# AI开源项目7个月前02.7K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成...最新AI资源# AI图像风格控制# AI开源项目7个月前03.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI资源# AI开源项目# AI编程# 智能体开发框架5个月前03.5K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器,由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...最新AI资源# AI开源项目7个月前02.8K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...最新AI资源# AI开源项目# 文档提取与清洗7个月前03K
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手综合介绍 Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集...最新AI资源# AI开源项目# AI编程7个月前05.2K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API7个月前03.1K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...最新AI资源# AI开源项目# AI搜索工具7个月前02.8K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI资源# AI开源项目# AI编程7个月前03.3K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新AI资源# AI开源项目7个月前02.5K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语...最新AI资源# AI开源项目# AI语音克隆# 多模态实时互动产品7个月前03.2K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI资源# AI开源项目# AI语音转文本# AI音视频编辑7个月前03.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用,旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色,满足企业个性化需求,并且具备知识库管理功能,支...最新AI资源# AI开源项目# AI本地化聊天应用7个月前03.5K
小红书AI运营助手:自动生成和发布小红书文章综合介绍 小红书AI运营助手(xhsaipublisher)是一个专为在小红书平台上发布文章而设计的自动化工具。该项目结合了图形用户界面与自动化脚本,利用大模型技术生成内容,并通过浏览器自动登录和发布...最新AI资源# AI副业赚钱项目# AI开源项目7个月前03.8K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号综合介绍 微信 Markdown 编辑器(WeChat Markdown Editor)是一款高度简洁的微信图文排版工具,旨在帮助用户轻松创建美观的微信文章。该编辑器支持所有基础的 Markdown ...最新AI资源# AI开源项目# AI生活效率助手7个月前02.7K
Orchestra:构建智能AI团队,让多智能体协作开发更简单高效综合介绍 Orchestra是一个创新的轻量级Python框架,专注于构建基于大语言模型(LLM)的多智能体协作系统。它采用独特的智能体编排方法,让多个AI智能体能够像交响乐团一样和谐配合工作。通过模...最新AI资源# AI开源项目# 智能体开发框架7个月前02.1K
GraphAgent:构建知识图谱,自动化任务规划与执行综合介绍 GraphAgent是一个集成了图生成、任务规划和任务执行的自动化智能体系统。它能够处理结构化和非结构化数据,构建复杂的语义依赖关系图谱,并通过自我规划和工具匹配高效执行用户任务。Graph...最新AI资源# AI开源项目# 知识图谱7个月前02.3K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集综合介绍 Harbor是一个革新性的容器化LLM工具集,专注于简化本地AI开发环境的部署和管理。它通过简洁的命令行界面(CLI)和配套应用程序,让开发者能够一键启动和管理包括LLM后端、API接口、前...最新AI资源# AI开源项目# 本地部署开源大模型工具7个月前02.7K
TangoFlux:快速文本到配音转换工具,3秒钟生成30秒长音频综合介绍 TangoFlux 是一个由 DeCLaRe Lab 开发的高效文本到音频(TTA)生成模型。该模型能够在短短 3.7 秒内生成长达 30 秒的 44.1kHz 立体声音频。TangoFlu...最新AI资源# AI开源项目# AI音乐7个月前04.3K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程综合介绍 ExtractThinker 是一个灵活的文档智能工具,利用大型语言模型(LLMs)从文档中提取和分类结构化数据,提供类似 ORM 的无缝文档处理工作流。它支持多种文档加载器,包括 Tess...最新AI资源# AI开源项目# 文档提取与清洗7个月前02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...最新AI资源# AI开源项目# 桌面自动化智能体7个月前04.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具综合介绍 TryOffAnyone是一款突破性的AI图像处理工具,专门用于解决电商领域中服装展示的难题。它能够将真人穿着状态下的服装照片智能转换为平铺展示效果图,这项技术基于最新的Latent Dif...最新AI资源# AI开源项目# AI换脸与换装7个月前02.7K
Agentarium:管理和协调多个AI智能体之间的交互综合介绍 Agentarium 是一个强大的 Python 框架,专门用于管理和编排 AI 智能代理(Agent)。这个框架提供了灵活直观的方式来创建、管理和协调多个 AI 代理之间的交互。它采用 A...最新AI资源# AI开源项目# 智能体开发框架7个月前03.1K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型综合介绍 LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频7个月前04.1K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具综合介绍 ScrapeGraphAI是一个创新的Python网页抓取库,它巧妙地结合了大语言模型(LLM)和直接图逻辑来创建网站和本地文档的抓取管道。这个工具的独特之处在于它的简单性和强大功能的完美平...最新AI资源# AI开源项目# 文档提取与清洗7个月前02.2K
AnkiAIUtils:Anki闪卡学习AI工具集,自动优化记忆卡片的智能助手综合介绍 AnkiAIUtils是一套专为Anki闪卡学习系统设计的人工智能增强工具集。该工具由一位医学院学生开发,旨在通过AI技术自动改进用户在学习过程中遇到困难的卡片。它能够智能地为用户提供个性化...最新AI资源# AI开源项目# AI教育工具7个月前02.9K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI资源# AI图像风格控制# AI开源项目7个月前02.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图综合介绍 GitDiagram是一款创新的GitHub代码库可视化工具,能够将任何GitHub仓库快速转换为交互式系统架构图。它采用先进的AI技术(Claude 3.5 Sonnet),为开发者提供了...最新AI资源# AI开源项目# AI白板与信息图7个月前04.5K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架综合介绍 Eliza是一个先进的多智能体(Multi-Agent)开发框架,致力于简化自主智能体(Autonomous Agent)的构建和部署过程。它支持部署多个具有不同角色设定的智能体,可实现智能...最新AI资源# AI开源项目# 智能体开发框架7个月前04.1K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Co...最新AI资源# AI开源项目# AI文本转语音7个月前03.7K
Memary:利用知识图谱增强Agent长期记忆的开源项目综合介绍 Memary 是一个创新的开源项目,专注于为自主智能体提供长期记忆管理解决方案。该项目通过知识图谱和专门的记忆模块,帮助智能体突破传统上下文窗口的限制,实现更智能的交互体验。Memary 采...最新AI资源# AI开源项目# 智能体开发框架# 知识图谱7个月前04.4K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结综合介绍 AI-reads-books-page-by-page是一个基于Python开发的智能PDF书籍分析工具,它能够自动化地对PDF书籍进行逐页分析,提取关键知识点,并在指定页数间隔后生成阶段性...最新AI资源# AI开源项目# AI文本与音频/视频总结工具7个月前03.5K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库,为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术,实现了低延...最新AI资源# AI开源项目7个月前02.8K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交综合介绍 Melty是一款革命性的AI代码编辑器,它将聊天对话与Git版本控制完美结合。由来自Replicate的Charlie和Jackson共同开发,这款工具旨在解决传统AI编码工具的痛点。其最大...最新AI资源# AI开源项目# AI编程7个月前02.6K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程7个月前03K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文综合介绍 AnyText是一个革命性的多语言视觉文本生成和编辑工具,基于扩散模型开发。它能够在图像中生成自然、高质量的多语种文本,并支持灵活的文本编辑功能。该项目由研究团队开发,并在ICLR 2024...最新AI资源# AI图像生成辅助工具# AI图像风格控制# AI开源项目7个月前03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端综合介绍 AigcPanel是一款面向所有用户的一站式AI数字人制作系统,采用electron+vue3+typescript技术栈开发,支持Windows系统一键部署。系统设计以用户友好为核心,即使...最新AI资源# AI开源项目# AI数字人7个月前03.3K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架综合介绍 AIEditor 是一个由 AI 驱动的下一代富文本编辑器,基于 Web Component 开发,支持 Vue、React、Angular 等几乎所有主流前端框架。它兼容 PC Web 和...最新AI资源# AI写作# AI开源项目7个月前03.4K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用综合介绍 AI Dev Gallery是微软推出的一款专为Windows开发者设计的AI开发工具应用程序(目前处于公开预览版)。它提供了一个综合性平台,帮助开发者轻松地将AI功能集成到自己的Windo...最新AI资源# AI开源项目# 本地部署开源大模型工具7个月前02.8K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面综合介绍 Edge TTS Worker(依赖 edge-tts ) 是一个部署在 Cloudflare Worker 上的代理服务,它将微软 Edge TTS 服务封装成兼容 OpenAI 格式的 ...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音8个月前04K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI资源# AI开源项目# AI语音转文本8个月前03K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端综合介绍 Copilot后端代理服务是一个开源项目,旨在通过借助其他FIM模型(如DeepSeek)来管理GitHub Copilot插件服务端,同时支持多人共享官方账号。该服务支持多种IDE,包括V...最新AI资源# AI开放服务# AI开源项目8个月前02.8K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询综合介绍 Gemini Balance是一个基于FastAPI框架开发的OpenAI API代理服务,旨在提供高效的多API Key管理和优化功能。该项目支持Gemini模型调用,主要功能包括多API...最新AI资源# AI开源项目4个月前02.9K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端综合介绍 AIaW(AI as Workspace)是一个新一代的AI客户端,旨在提供全功能、轻量级且可拓展的解决方案。该平台支持多种服务商,包括OpenAI、Anthropic和Google等,能够...最新AI资源# AI开源项目# AI本地化聊天应用8个月前02.7K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词综合介绍 DeepSeek Engineer是一款基于DeepSeek API开发的强大编程助手工具,它能够通过直观的命令行界面与用户进行交互,协助完成各种软件开发任务。该工具将大型语言模型的能力与实...最新AI资源# AI开源项目6个月前03K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)综合介绍 OrionChat是一个基于网页的AI聊天界面,它为用户提供了一个统一的平台来与多个主流AI模型进行交互。该项目支持包括Ollama(本地运行)、OpenAI GPT、Google Gemi...最新AI资源# AI开源项目# AI本地化聊天应用8个月前02.6K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目8个月前03K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结综合介绍 AI2SRT是一个开源项目,利用GeminiAI大模型,为长视频一键生成解说短视频和视频总结,同时支持音视频转录字幕。该项目旨在简化视频内容创作过程,提供高效的字幕生成和翻译功能。用户可以通...最新AI资源# AI开源项目# AI音视频编辑8个月前03.1K
Open Notebook:个性化AI笔记工具,Notebook LM开源替代方案综合介绍 Open Notebook 是一个开源的、注重隐私保护的笔记管理工具,旨在为用户提供一个替代 Google Notebook LM 的解决方案。通过 Open Notebook,用户可以在自...最新AI资源# AI开源项目# AI笔记8个月前03.6K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体8个月前02.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐综合介绍 DisPose是一个创新的开源人工智能项目,专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源,采用先进的深度学习技术,通过分解骨骼姿态信息来实现精确的人物动画控制。D...最新AI资源# AI图像转视频# AI开源项目8个月前02.5K
Smolagents:快速开发AI智能体,轻量级构建智能体的开源项目综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...最新AI资源# AI开源项目# 智能体开发框架7个月前04.2K
Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...最新AI资源# AI开源项目# 文档提取与清洗8个月前02.8K
InvSR:开源图像超分辨率项目,提升图像分辨率质量综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...最新AI资源# AI图像放大与修复# AI开源项目8个月前03.5K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成综合介绍 Infinity是一个开创性的高分辨率图像生成框架,由FoundationVision团队开发。该项目通过创新的位级视觉自回归建模方法,突破了传统图像生成模型的限制。Infinity的核心特...最新AI资源# AI在线生成图像# AI开源项目8个月前03.5K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序综合介绍 GeminiCoder是一个基于Google Gemini API开发的创新型Web应用程序生成工具。该项目继承了 LlamaCoder 的优秀特性,并集成了最新的Gemini 1.5 Pr...最新AI资源# AI开源项目# AI编程8个月前02.9K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案综合介绍 GPTMe是一款革命性的终端AI助手工具,专为提升开发者工作效率而设计。它将强大的AI能力与终端环境完美结合,支持代码执行、文件编辑、网页浏览和视觉识别等多样化功能。作为ChatGPT代码解...最新AI资源# AI开源项目# AI编程8个月前02.9K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况综合介绍 ChatGPT 服务降级监测工具是一个开源项目,旨在帮助用户检测其 ChatGPT 服务是否因高风险 IP 而被降级。该工具通过分析 Proof of Work (PoW) 难度值,判断用户...最新AI资源# AI开源项目8个月前02.8K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI资源# AI图像风格控制# AI开源项目8个月前03.3K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成综合介绍 SimGRAG(SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前02.9K
KAG:知识图谱与向量混合检索的专业知识库问答框架综合介绍 KAG (Knowledge Augmented Generation) 是一个基于OpenSPG引擎和大语言模型(LLMs)的逻辑形式引导的推理和检索框架。该框架专门用于构建专业领域知识库...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架8个月前04.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权综合介绍 VideoSeal是由Facebook Research开发的开源视频水印工具,旨在提供高效的视频水印嵌入与提取功能。该工具支持最新的开源模型,包含预训练模型、训练代码、推理代码和评估工具...最新AI资源# AI开源项目# AI音视频编辑8个月前02.8K
Obsidian Copilot:在Obsidian中使用AI助手体验智能化笔记助手综合介绍 Obsidian Copilot是一款强大的Obsidian笔记软件AI助手插件,它将OpenAI的智能技术无缝集成到Obsidian笔记工作流中。这款插件由开发者Logan Yang创建...最新AI资源# AI开源项目# AI笔记8个月前04.3K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库综合介绍 Languine 是一个由 Midday 开发的强大翻译工具,旨在帮助开发者简化应用程序的本地化过程。通过 Languine,开发者可以利用 AI 技术快速生成准确且符合上下文的翻译,支持超...最新AI资源# AI开源项目# AI翻译8个月前02.9K