Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装12个月前035.5K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频综合介绍 MoneyPrinterTurbo 是一个开源项目,利用先进的AI大模型技术,实现了一键生成高清短视频的功能。用户只需提供一个视频主题或关键词,系统便会自动生成视频文案、视频素材、视频字幕和...最新AI资源# AI开源项目# AI视频生成工具9个月前035.4K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息综合介绍 MCP Server ChatSum 是一个开源项目,旨在帮助用户查询和总结聊天消息。该项目托管在 GitHub 上,提供了一个强大的工具集,允许用户根据特定参数查询聊天记录,并生成相应的总...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# MCP服务9个月前035.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...最新AI资源# AI开源项目# 桌面自动化智能体10个月前035.4K
LHM:从单张图片生成支持动作的3D人体模型综合介绍 LHM(Large Animatable Human Reconstruction Model)是一个开源项目,它由aigc3d团队开发,能从一张图片快速生成支持动作的3D人体模型。核心特色...最新AI资源# AI开源项目# AI文本与图片转3D8个月前035.4K
PRAG:提升问答系统性能的参数化检索增强生成工具综合介绍 PRAG(Parametric Retrieval-Augmented Generation)是一个创新的检索增强生成工具,旨在通过将外部知识直接嵌入大语言模型(LLM)的参数空间,提升生成...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前035.4K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体10个月前035.4K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。项目托管在GitHub上...最新AI资源# AI开源项目# AI教育工具9个月前035.4K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本10个月前035.3K
HivisionIDPhotos:开源智能AI证件照制作工具综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具,能够智能识别用户拍照场景并进行抠图,生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸,未来还将推出美颜和...最新AI资源# AI开源项目# AI抠图改背景1年前035.3K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts综合介绍 LangChain推出的Open Canvas 是一个开源的网络应用程序,旨在通过内置的双代理记忆功能来提升文档编辑和协作体验,并且集成smith可以观察完整的执行细节。该平台受 OpenA...最新AI资源# AI写作# AI开源项目# AI画布9个月前035.3K
Novel:模仿Notion AI的开源写作编辑器综合介绍 这是一个由Steven Tey开发的开源项目,名为Novel,它是一个Notion风格的所见即所得文本编辑器,集成了AI自动补全功能,可助力用户提升文字输入效率。项目提供了详尽的文档和安装指...最新AI资源# AI写作# AI开源项目1年前035.3K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人综合介绍 Base Chat 是一个多租户聊天机器人,使用 Ragie Connect 连接并与组织的知识库进行对话。该项目是 Ragie 多项功能的参考应用,基于 Next.js 构建,支持 Goo...最新AI资源# AI开源项目# AI本地化聊天应用9个月前035.3K
AI Podcast Generator:自动抓取新闻生成音频播客综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前035.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音(TTS)模型库,旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格(如性别、音调、说话风...最新AI资源# AI开源项目# AI文本转语音10个月前035.3K
Coding Agent:基于Langgraph构建的简单编程助手综合介绍 Coding Agent 是一个由 AbhinavTheDev 开发的智能编程助手,旨在帮助开发者提高编程效率。该工具利用人工智能技术,能够自动生成代码、提供编程建议,并协助开发者完成各种编...最新AI资源# AI开源项目# AI编程10个月前035.3K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模...最新AI资源# AI开源项目# 无代码开发# 知识检索与RAG框架10个月前035.3K
olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别综合介绍 olmOCR 是由 Allen Institute for Artificial Intelligence (AI2) 的 AllenNLP 团队开发的一款开源工具,专注于将 PDF 文件转...最新AI资源# AI开源项目# 文档提取与清洗9个月前035.3K
Knowledge Table:高效提取与探索结构化数据的开源工具综合介绍 知识表(Knowledge Table)是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示,如表格和图形。该工具支持自定义提...最新AI资源# AI开源项目# 知识图谱1年前035.3K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体...最新AI资源# AI开源项目# AI搜索工具11个月前035.2K
LivePortrait:静态图像、视频生成动态肖像动画工具综合介绍 LivePortrait 是一款由快手科技开发的先进 AI 动态肖像动画工具。它利用创新的 AI 技术,将静态图像转化为生动的视频动画。无论是使用真实照片、动画风格还是艺术肖像,LivePo...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格1年前035.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows...最新AI资源# AI开源项目# AI语音克隆12个月前035.2K
PromptWizard:优化提示工程的开源框架,提升任务性能综合介绍 PromptWizard是微软开发的一个开源框架,采用自我进化机制,可以让模型自己生成、评价和改进提示词及生成示例,通过不断反馈来提高输出质量。它能够自主优化提示词、生成和选择合适的示例、并...最新AI资源# AI开源项目11个月前035.2K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格综合介绍 Maxun是一个开源的无代码网页数据提取平台,用户可以在几分钟内训练机器人,自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动,能够适应网站布局的变化,提供强大的数据抓取功能...最新AI资源# AI开源项目# 文档提取与清洗11个月前035.2K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码综合介绍 Onlook是一款开源的设计工具,专为设计师和开发者打造,允许用户直接在运行的React应用中进行设计,并将设计修改转换为代码。该工具提供了一种直观的视觉编辑体验,类似于Figma或Webf...最新AI资源# AI开源项目# AI页面设计10个月前035.2K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室(Ali-Vilab)开发的一个开源项目,专注于线稿上色的自动化处理。这一工具通过深度学习技术,实现了对参考图像的精确色彩匹配,极大地提高...最新AI资源# AI图像风格控制# AI开源项目10个月前035.2K
"Always-On" Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统...最新AI资源# AI开源项目# 多模态实时互动产品11个月前035.2K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像综合介绍 OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...最新AI资源# AI在线生成图像# AI开源项目1年前035.2K
自动爬取小说并生成多角色有声书的工具综合介绍 Auto-Audio-Book 是一个开源项目,托管在 GitHub 上。它能自动从网站爬取小说内容,并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...最新AI资源# AI副业赚钱项目# AI开源项目8个月前035.1K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具综合介绍 Bilingual Book Maker 是一个开源项目,旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译,支持多种文件格式,包括epub、txt和srt...最新AI资源# AI开源项目# AI翻译10个月前035.1K
TableGPT Agent:专为分析复杂表格数据设计的智能工具综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具,专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型,利用自然语言交互的方式,让用户能够轻松查询、操...最新AI资源# AI开源项目# AI数据分析9个月前035.1K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cp...最新AI资源# AI开源项目# AI本地化聊天应用1年前035.1K
OpenAI.fm:展示OpenAI语音API的交互式演示工具综合介绍 openai-fm 是一个开源项目,托管在 GitHub 上,专门用于展示 OpenAI 文本转语音(Text-to-Speech, TTS)API 的功能。这个项目通过一个交互式网页应用...最新AI资源# AI开源项目7个月前035.1K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI资源# AI开源项目# AI视频转换风格10个月前035.1K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆1年前035.1K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和...最新AI资源# AI图像生成辅助工具# AI开源项目11个月前035.1K
Memobase:为AI应用提供基于用户画像的长期记忆方案综合介绍 Memobase 是一个基于用户画像的记忆系统,旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手,Memobase 都能帮助您的AI记住、理解并随着用...最新AI资源# AI开源项目9个月前035K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目11个月前035K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告8个月前035K
MCP Playwright:提供浏览器自动化操作的MCP服务综合介绍 MCP-Playwright 是一个由 ExecuteAutomation 开发并托管在 GitHub 上的开源工具。它基于 Playwright 和 Model Context Proto...最新AI资源# AI开源项目# MCP服务9个月前035K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目,旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型(LLM...最新AI资源# AI开源项目# AI教育工具9个月前035K
GraphGen:利用知识图谱生成合成数据微调语言模型综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...最新AI资源# AI开源项目# 大模型微调# 知识图谱7个月前034.9K
LLM API Engine:通过自然语言快速生成和部署API综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主...最新AI资源# AI开源项目10个月前034.9K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI综合介绍 ChatOllama是一个基于大型语言模型(LLM)的开源在线聊天应用项目,支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理(列表展示、下载、删除)、与模型聊天等功能。项目运用了...最新AI资源# AI开源项目# AI本地化聊天应用# 知识检索与RAG框架1年前034.9K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型综合介绍 Step-Video-T2V是由StepFun AI(阶跃星辰)推出的一款先进的文本到视频转换模型。该模型拥有30亿参数,能够生成长达204帧的视频。通过深度压缩变分自编码器(VAE),模型...最新AI资源# AI开源项目# AI文本转视频9个月前034.9K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自...最新AI资源# AI开源项目# 桌面自动化智能体9个月前034.9K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...最新AI资源# AI开源项目# AI本地化聊天应用10个月前034.9K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具综合介绍 lightcard 是一个简洁优雅的卡片生成工具,旨在帮助用户轻松创建精美的内容卡片。该工具支持自定义文字内容、多种主题样式和二维码,让创作变得更加简单有趣。用户可以通过编辑标题、正文和作者...最新AI资源# AI开源项目11个月前034.9K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师综合介绍 Srcbook是一个以TypeScript为核心的应用开发平台,旨在通过AI助手快速创建和迭代Web应用。它支持本地运行,提供交互式笔记本界面,允许用户编写和执行后端代码。Srcbook是开...最新AI资源# AI开源项目# AI编程1年前034.9K
语析(Yuxi-Know):基于知识图谱的智能问答平台综合介绍 Yuxi-Know 是一个开源的智能问答平台,结合知识图谱和 RAG(检索增强生成)技术,帮助用户快速获取精准答案。它基于 Neo4j 存储知识图谱,使用 FastAPI 和 VueJS 构...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架8个月前034.9K
AIBot PRO:集成多种AI产品的商业化聚合平台综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端,旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话,集成了ChatGPT、Gemini、Claude、文心一言...最新AI资源# AI副业赚钱项目# AI开源项目# AI集成多模型对话平台9个月前034.9K
SemHash:快速实现语义文本去重,提升数据清理效率综合介绍 SemHash 是一个轻量级且灵活的工具,用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN(近似最近邻)相似性搜索。SemHa...最新AI资源# AI开源项目# 文档提取与清洗10个月前034.9K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。综合介绍 Ant Design X是蚂蚁集团开源的一个工具包,旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板,支持与OpenAI标准兼容的模型集成,适用于智能客服、AI助手等多种应...最新AI资源# AI开源项目1年前034.9K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品10个月前034.9K
Arrakis:为AI智能体提供安全沙盒环境的开源工具综合介绍 Arrakis 是一个专为 AI 智能体设计,提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发,托管在 GitHub 上,使用 AGPL v3 许可证。Arrak...最新AI资源# AI开源项目8个月前034.8K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体11个月前034.8K
Lux:几乎支持所有视频平台的命令行视频下载器综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频,包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能,如多线程下载...最新AI资源# AI开源项目10个月前034.8K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目1年前034.8K
Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...最新AI资源# AI开源项目# AI生活效率助手# 大模型微调8个月前034.8K
Yek:读取git仓库文本文件并快速分块,以供大模型使用综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...最新AI资源# AI开源项目# 文档提取与清洗10个月前034.8K
RLAMA:命令行操作的本地文档智能问答 RAG 系统综合介绍 RLAMA 是一个由 DonTizi 开源开发并托管于 GitHub 的文档智能问答 RAG(检索增强生成)系统,其核心特色在于通过命令行操作实现功能。用户可以通过简洁的终端命令,连接本地 ...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前034.7K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现,适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确...最新AI资源# AI开源项目# AI文本转视频1年前034.7K
基于Cloudflare Worker的AI图片生成脚本综合介绍 CloudFlare-AI-Image 是一个开源项目,托管在 GitHub 上,通过 Cloudflare Workers 平台提供免费的 AI 图像生成服务。它支持文生图和图生图功能,基...最新AI资源# AI开源项目# 免费大模型API8个月前034.7K
DeepRant:实时翻译游戏聊天内容的开源客户端综合介绍 DeepRant 是一款专为游戏玩家打造的开源翻译工具,旨在解决国际服务器中语言不通的问题。它通过快捷键实现游戏内文字的即时翻译,支持多种语言互译,让玩家无需退出游戏即可快速理解和回复聊天信...最新AI资源# AI开源项目# AI翻译9个月前034.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)综合介绍 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX.1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器...最新AI资源# AI开源项目7个月前034.6K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务9个月前034.6K
Quadratic:集成AI对话和代码执行的在线数据分析表格综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic...最新AI资源# AI开源项目# AI数据分析9个月前034.6K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品10个月前034.6K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic...最新AI资源# AI开源项目# AI数字人11个月前034.6K
Autiobooks:将epub电子书转换为m4b有声书综合介绍 Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由...最新AI资源# AI开源项目# AI文本转语音9个月前034.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目综合介绍 Llama Tutor 是一个基于 Llama 3.1 构建的开源 AI 个人助教项目,旨在为用户提供个性化的学习体验。通过整合多种技术栈,如 Together AI、Next.js 和 T...最新AI资源# AI开源项目# AI教育工具1年前034.5K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本11个月前034.5K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况综合介绍 ChatGPT 服务降级监测工具是一个开源项目,旨在帮助用户检测其 ChatGPT 服务是否因高风险 IP 而被降级。该工具通过分析 Proof of Work (PoW) 难度值,判断用户...最新AI资源# AI开源项目11个月前034.5K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本综合介绍 Fragments by E2B是一个开源项目,提供了一个基于Next.js的模板,用于构建完全由AI生成的应用程序。该项目由 E2B 开发,旨在简化和加速AI应用的开发过程。它集成了多种现...最新AI资源# AI开源项目# AI编程1年前034.5K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统综合介绍 R2R(RAG to Riches)是一个先进的AI检索系统,支持检索增强生成(RAG)功能,具备生产就绪的特性。该系统基于容器化的RESTful API构建,提供多模态内容解析、混合搜索功...最新AI资源# AI开源项目# 知识检索与RAG框架11个月前034.5K
DiffBIR:提升图像质量的智能修复工具综合介绍 DiffBIR(Blind Image Restoration with Generative Diffusion Prior)是一个由XPixelGroup开发的图像修复工具,旨在通过生成...最新AI资源# AI图像放大与修复# AI开源项目10个月前034.5K
Langui:开源的AI用户界面组件库综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...最新AI资源# AI开源项目# AI页面设计10个月前034.5K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI资源# AI开源项目# AI编程11个月前034.5K
MemFree:本地知识库与搜索信息混合的AI搜索引擎综合介绍 MemFree 是一个先进的混合AI搜索引擎,能够通过文本、图像、文件和网页进行搜索和提问。它提供一键获取文本、思维导图、图像和视频的搜索结果的功能。MemFree 的目标是从用户的知识库和...最新AI资源# AI开源项目# AI搜索工具1年前034.5K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目8个月前034.4K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格12个月前034.4K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体11个月前034.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程综合介绍 VimLM是一个Vim插件,提供了一个由本地LLM(大语言模型)驱动的代码助手。通过Vim命令与本地LLM模型交互,自动获取代码上下文,帮助用户在Vim中进行代码编辑。VimLM的设计灵感来...最新AI资源# AI开源项目# AI编程9个月前034.4K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码综合介绍 Devika是一个先进的AI软件工程师,能够理解高阶人类指令,将其分解为步骤,研究相关信息,并编写代码以实现给定的目标。它利用大型语言模型、规划和推理算法以及网页浏览能力,智能地开发软件。D...最新AI资源# AI开源项目# AI编程# 智能体应用9个月前034.4K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新AI资源# AI开源项目8个月前034.3K
TripoSG:单张图像生成高分辨率3D建模数字资产综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目,能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术,结合混合监督训练和优质数据集,让生成的 3D 模型拥有...最新AI资源# AI开源项目# AI文本与图片转3D8个月前034.3K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置综合介绍 DragGAN是一个基于生成对抗网络(GAN)的交互式图像编辑工具。该项目由Xingang Pan等人在2023年SIGGRAPH会议上发布,旨在通过简单的点选和拖拽操作,让用户能够直观地操...最新AI资源# AI图像编辑# AI开源项目12个月前034.3K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...最新AI资源# AI开源项目# AI搜索工具11个月前034.3K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台综合介绍 AutoGPT是一个强大的平台,旨在帮助用户创建、部署和管理连续运行的AI代理,自动化复杂的工作流。该平台由Significant Gravitas开发,提供了多种工具和功能,使用户能够专注...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架12个月前034.3K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富综合介绍 UltraPixel 是一项先进的超高分辨率图像生成技术,旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发,并在 NeurIPS 2024 上展示。U...最新AI资源# AI在线生成图像# AI开源项目1年前034.3K
ALog:便携AI语音日记应用,支持语音转文字。综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文...最新AI资源# AI开源项目# AI语音转文本10个月前034.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理...最新AI资源# AI开源项目10个月前034.3K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具,旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道,通过参考图像池准确生成各种元素的颜色,包括角色的头发颜色和服...最新AI资源# AI图像风格控制# AI开源项目11个月前034.2K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架综合介绍 AIEditor 是一个由 AI 驱动的下一代富文本编辑器,基于 Web Component 开发,支持 Vue、React、Angular 等几乎所有主流前端框架。它兼容 PC Web 和...最新AI资源# AI写作# AI开源项目11个月前034.2K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前034.2K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Pr...最新AI资源# AI开源项目# 大模型微调9个月前034.2K
Neural4D:生成高分辨率3D建模数字资产的AI平台综合介绍 Neural4D 是一个基于人工智能的创新平台,专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发,依托世界领先的端到端3D生成大模型技...最新AI资源# AI开源项目# AI文本与图片转3D9个月前034.2K
DevDocs:快速抓取并整理技术文档的MCP服务综合介绍 DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Ma...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗8个月前034.2K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI资源# AI开源项目# AI数字人1年前034.2K