Kreuzberg:从任何文档中提取文本的开源工具综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generatio...最新AI资源# AI开源项目# 文档提取与清洗6个月前02K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求...最新AI资源# AI图像转视频# AI开源项目6个月前01.9K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包,专注于音乐、歌曲和音频生成。它提供了一个统一的框架,通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。Inspire...最新AI资源# AI开源项目# AI音乐5个月前02.7K
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI资源# AI开源项目# 免费大模型API6个月前02.7K
wdoc:从海量、多源文档中检索内容并总结知识综合介绍 wdoc是一个功能强大的RAG(检索增强生成)系统,专为处理和分析大量多样化的文档而设计。它能够从各种文件类型中进行检索,包括PDF、网页、YouTube视频、音频文件等。wdoc特别适合处...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.6K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频综合介绍 Magic 1-For-1 是一个高效的视频生成模型,旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务:文本到图像生成和图像到视频生成,从而实现更高效的训练和蒸馏...最新AI资源# AI开源项目# AI文本转视频6个月前02.6K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告综合介绍 DataLine是一个强大的AI数据分析和可视化工具,旨在帮助用户通过简单的操作与各种数据源进行交互。无论是CSV文件还是主流数据库如Postgres、MySQL、Snowflake、SQL...最新AI资源# AI开源项目# AI数据分析6个月前02.8K
FinRobot:提升金融数据分析效率和投资研究的的智能体综合介绍 FinRobot是由AI4Finance Foundation开发的开源AI智能平台,专为金融分析设计。它不仅涵盖了传统的语言模型,还融入了多种AI技术,旨在为金融行业提供全面的解决方案。F...最新AI资源# AI开源项目# AI金融数据分析6个月前02.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统综合介绍 Simba是一个便携式知识管理系统(KMS),旨在与任何检索增强生成(RAG)系统无缝集成。该项目由GitHub用户GitHamza0206创建,提供了一种高效的知识管理解决方案,适用于各种...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.3K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具综合介绍 LocalPdfChatRAG是一个开源项目,旨在通过结合本地PDF文档和检索增强生成(RAG)模型,实现智能聊天功能。该项目允许用户上传PDF文档,并通过自然语言提问的方式,从文档中获取相...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.4K
Deep Searcher:企业私有文档高效检索与智能问答综合介绍 Deep Searcher 是一个结合强大大语言模型(如 DeepSeek 和 OpenAI)和向量数据库(如 Milvus)的工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)综合介绍 Flashcard是一个开源的语言学习工具,旨在提供一个替代Duolingo的解决方案。该项目由Steven Lynn(GitHub用户名:stvlynn)开发,采用现代化的用户界面和多语言...最新AI资源# AI开源项目# AI教育工具6个月前02.3K
LineAvatars:生成 Notion 风格线条头像的免费工具综合介绍 LineAvatars 是一个免费且简单易用的在线工具,专门用于生成 Notion 风格的线条头像。用户可以上传照片或通过摄像头拍摄一张照片,系统会使用 AI 自动生成一个线条头像。这个工具...最新AI资源# AI图像风格控制# AI开源项目6个月前02.4K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频综合介绍 Goku是一款基于流变换技术的联合图像和视频生成模型,旨在实现行业级的性能表现。它整合了先进的高质量视觉生成技术,包括精细的数据整理、模型设计和流变换公式。Goku的主要贡献包括高质量的细粒...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频6个月前03.2K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash(实验性)模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互,提供实时低延迟的用...最新AI资源# AI开源项目# 多模态实时互动产品6个月前04K
Data Formulator:AI驱动的数据可视化工具综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代...最新AI资源# AI开源项目# AI数据分析6个月前02.8K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用6个月前03.5K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要综合介绍 Meetily是一款由Zackriya Solutions开发的AI驱动会议助手,能够实时捕捉会议音频,进行语音转录,并生成会议摘要。其独特之处在于所有处理均在本地设备上完成,确保用户隐私...最新AI资源# AI开源项目# AI文本与音频/视频总结工具6个月前03.1K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型综合介绍 DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型,显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文...最新AI资源# AI开源项目# 多模态实时互动产品6个月前03K
Zonos:高质量语音合成与语音克隆工具综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型,能够生成高质量的语音输出。该工具支持多种语言...最新AI资源# AI开源项目# AI语音克隆6个月前03.2K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件综合介绍 ChatGPT Box 是一个开源的浏览器扩展工具,旨在将 ChatGPT 深度集成到用户的浏览器中。该工具由 josStorer 开发,支持多种语言,并提供多种功能,如在任意页面调用聊天对...最新AI资源# AI开源项目# AI集成多模型对话平台# 浏览器AI助手4个月前02.6K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件综合介绍 WordPress AI助手插件(wp-ai-chat)是一个开源的WordPress插件,旨在为用户提供多种AI功能,包括AI对话、文章生成、文章总结、文章翻译和内容朗读。该插件支持对接多...最新AI资源# AI写作# AI开源项目6个月前02.6K
promptfoo:提供安全可靠的LLM应用测试工具综合介绍 promptfoo 是一个开源的命令行工具和库,专门用于评估和红队测试大语言模型(LLM)应用。它为开发者提供了一套完整的工具,用于构建可靠的提示、模型和基于检索的生成(RAGs),并通过自...最新AI资源# AI开源项目6个月前02.6K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话综合介绍 NoneBot DeepSeek 插件是一个集成了 DeepSeek 模型的 NoneBot 插件,旨在提供智能对话与问答功能。通过接入 DeepSeek 模型,用户可以在 NoneBot ...最新AI资源# AI客服机器人# AI开源项目6个月前02.5K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包综合介绍 Solana Agent Kit是一个开源工具包,旨在将AI智能体与Solana区块链协议无缝连接。无论是AI研究人员还是加密货币开发者,都可以使用任何模型训练的智能体,通过该工具包执行超过...最新AI资源# AI开源项目# 智能体开发框架6个月前02.5K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言综合介绍 LiberSonora,寓意“自由的声音”,是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能,能够在GPU加速下进行批量离线处理。LiberSo...最新AI资源# AI开源项目# AI翻译# AI语音转文本6个月前02.4K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情,提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地,确保用户...最新AI资源# AI开源项目# AI金融数据分析6个月前02.9K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具,旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎,包括Google Translate、Microsoft Tra...最新AI资源# AI开源项目# AI翻译6个月前02.7K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能综合介绍 KTransformers:专为突破大模型推理瓶颈而生的高性能 Python 框架。 它不仅仅是一个简单的模型运行工具,更是一套 极致的性能优化引擎 和 灵活的接口赋能平台。 KTransf...最新AI资源# AI开源项目6个月前03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前03K
Tifa-Deepsex-14b-CoT:擅长角色扮演与超长小说生成的大模型综合介绍 Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型,专注于角色扮演、小说文本生成以及思维链(Chain of Thought, CoT)推...最新AI资源# AI开源项目# AI角色扮演6个月前06.6K
Instructor:简化大语言模型结构化输出工作流的Python库综合介绍 Instructor 是一个流行的 Python 库,专为处理大语言模型(LLMs)的结构化输出而设计。它基于 Pydantic 构建,提供了一个简单、透明且用户友好的 API,用于管理数据...最新AI资源# AI开源项目# 文档提取与清洗6个月前02.4K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...最新AI资源# AI开源项目# 智能体应用# 视觉目标检测5个月前02.7K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人综合介绍 LangBot 是一个基于大模型的即时通信机器人平台,支持多种消息平台和大模型。该平台适配 QQ、微信(企业微信、个人微信)、飞书、Discord、OneBot 等消息平台,并支持 Open...最新AI资源# AI开源项目6个月前02.9K
zChunk:基于Llama-70B的通用语义分块策略综合介绍 zChunk是由ZeroEntropy开发的一种新型分块策略,旨在为通用语义分块提供解决方案。该策略基于Llama-70B模型,通过提示生成分块,优化了文档的分块过程,确保在信息检索时保持高...最新AI资源# AI开源项目# 文档提取与清洗6个月前02.4K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译6个月前03.3K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话综合介绍 Qwen4Mac是一个开源项目,旨在将Qwen大语言模型(LLM)集成到Mac的菜单栏中,方便用户随时调用和使用。该项目由andreaturchet开发和维护,提供了一种简便的方式,让用户能...最新AI资源# AI开源项目6个月前02.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)综合介绍 口袋AI(PocketPal AI 中文版)是一款强大的离线AI助手,旨在让用户随时随地与AI进行对话。该项目基于小型语言模型(SLMs),无需联网即可在手机上运行,特别适配中文用户体验。口...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.1K
Kokoro WebGPU:浏览器中离线运行的文本转语音服务综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...最新AI资源# AI开源项目# AI文本转语音6个月前03.4K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划综合介绍 OpenHealthForAll 是一个开源项目,旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术,OpenHealthForAll 提供了一个本地运行的健康助手,帮助用户更好地管理...最新AI资源# AI开源项目# AI生活效率助手6个月前02K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新AI资源# AI开源项目6个月前02.6K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新AI资源# AI开源项目# prompt越狱6个月前02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新AI资源# AI开源项目# 视觉目标检测6个月前02.4K
VisoMaster:强大且易用的图片/视频换脸和编辑软件综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具,利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频,VisoMaster 都能通过简单的操作生成高质量的换脸结果,适合普通...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸6个月前04.1K
基于RAG构建提供健康建议的小助手(实验项目)综合介绍 LLM-RAG-Longevity-Coach 是一个基于大语言模型(LLM)和检索增强生成(RAG)技术的聊天机器人,旨在为用户提供个性化的健康和长寿建议。该项目由 Tyler Burle...最新AI资源# AI开源项目# AI生活效率助手6个月前02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 F...最新AI资源# AI开源项目# 大模型微调6个月前02.6K
One-Prompt-One-Story:文本提示生成角色身份一致的图像综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具,旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...最新AI资源# AI图像风格控制# AI开源项目6个月前02.1K
为Next.js应用程序添加RAG驱动的在线聊天工具综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件,旨在提供基于RAG(检索增强生成)技术的AI聊天界面。该组件结合了Upstash V...最新AI资源# AI开源项目6个月前02.2K
AudioNotes:快速提取音视频内容并生成结构化笔记综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容,并调用大模型进行整理,生成一份结构化的 Markdown 笔记,方便用...最新AI资源# AI开源项目# AI语音转文本6个月前02.6K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具综合介绍 Bilingual Book Maker 是一个开源项目,旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译,支持多种文件格式,包括epub、txt和srt...最新AI资源# AI开源项目# AI翻译6个月前02.7K
Rowfill:批量提取文档结构化信息并自动化分析综合介绍 Rowfill 是一个开源的文档处理平台,专为知识工作者设计。它利用先进的人工智能技术,从复杂的文档、图像和PDF中提取、分析和处理数据。Rowfill 支持本地大语言模型(LLM)和Ope...最新AI资源# AI开源项目# AI数据分析# 文档提取与清洗6个月前02.3K
PRAG:提升问答系统性能的参数化检索增强生成工具综合介绍 PRAG(Parametric Retrieval-Augmented Generation)是一个创新的检索增强生成工具,旨在通过将外部知识直接嵌入大语言模型(LLM)的参数空间,提升生成...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前03.5K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告综合介绍 GPT Researcher 是一个基于大型语言模型(LLM)的自主代理工具,旨在进行本地和网络研究,并生成详细的研究报告。该工具通过并行化代理工作,提供稳定的性能和更快的速度,确保信息的准...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.2K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验综合介绍 Linly-Talker 是一个创新的数字人对话系统,结合了大语言模型(LLMs)与视觉模型,创造出一种新颖的人机互动方式。该系统集成了多种技术,如 Whisper、Linly、Micros...最新AI资源# AI开源项目# AI数字人6个月前02.6K
Airweave:让应用程序快速集成知识库,实现智能搜索综合介绍 Airweave 是一个开源工具,旨在通过同步用户的应用数据、API、数据库和网站到图谱和向量数据库,使任何应用程序变得可搜索。Airweave 简化了数据可搜索化的过程,无论是结构化数据还...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.2K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用综合介绍 ai-gradio是一个开源的Python工具包,旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建,提供了一个统一的接口,支持多种AI模型和服务。无论是文本、语音还是视频...最新AI资源# AI开源项目6个月前02.9K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告综合介绍 OpenDeepResearcher 是一个开源的自动化深度研究工具,旨在通过人工智能技术提升研究效率。该项目由 mshumer 开发,托管在 GitHub 上。OpenDeepResear...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别(OCR)或文本提取,避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式,包括 PDF...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.6K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具,支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识...最新AI资源# AI开源项目6个月前03.8K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板综合介绍 n8n自托管AI入门套件是一个开源的Docker Compose模板,旨在快速初始化一个全面的本地AI和低代码开发环境。由n8n团队精心策划,该套件结合了自托管的n8n平台和一系列兼容的AI...最新AI资源# AI开源项目6个月前03.2K
Gemini Teacher:英语口语发音纠正助手综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通...最新AI资源# AI开源项目# AI教育工具6个月前02.7K
bilive:B站无人监守直播录制与自动切片、上传工具综合介绍 bilive是一个专为B站直播录制设计的工具,提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器,支持7x24小时无人值守录制,自动识别并渲染弹幕和字幕,自动切片并...最新AI资源# AI开源项目# AI音视频编辑6个月前02.7K
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI资源# AI开源项目6个月前02.9K
PPTX2MD:将PPTX文件转换为Markdown的专用工具综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超...最新AI资源# AI开源项目# 文档提取与清洗6个月前02.3K
DSPy Examples:展示DSPy功能的实用示例综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库,展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能,帮助开发者更好地理解...最新AI资源# AI开源项目6个月前02.8K
Go-Proxy:Docker集成的高性能反向代理服务器综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器,主要用于在不同网络环境中提供代理服务。它支持多种协议,包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP,能...最新AI资源# AI开源项目6个月前02.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具综合介绍 CoT-Lab(人机协同思维实验室)是一个探索人机协作新范式的实验性界面。基于认知负荷理论和主动学习原则,CoT-Lab 通过创建“思维伙伴”关系,促进人类与人工智能的深度认知对齐。该项目旨...最新AI资源# AI开源项目6个月前02.2K
让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展,旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid...最新AI资源# AI开源项目6个月前02.5K
Orate:集成知名语音生成、语音转录与变声模型的统一API综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本6个月前02.9K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合综合介绍 Reflex LLM Examples是一个由Reflex开发团队创建的开源项目,旨在展示大语言模型(LLM)的实际应用。该项目汇集了多个基于Reflex构建的AI应用,展示了来自Googl...最新AI资源# AI开源项目6个月前02.1K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.5K
BEN2:从图像、视频中快速移除背景的深度学习模型综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confiden...最新AI资源# AI开源项目# AI抠图改背景2个月前03.8K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...最新AI资源# AI开源项目# 多模态实时互动产品6个月前02.8K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用,主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能...最新AI资源# AI开源项目# AI搜索工具6个月前02.6K
LLM API Engine:通过自然语言快速生成和部署API综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主...最新AI资源# AI开源项目6个月前02.2K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程...最新AI资源# AI开源项目# AI语音转文本6个月前02.3K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档综合介绍 Doc2XAPITranslate 是一个强大的文档全文翻译工具,专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器,包括DeepSeek、OpenAI、O...最新AI资源# AI开源项目# AI翻译6个月前02.6K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统,基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应,支持自然流畅的实...最新AI资源# AI开源项目# 多模态实时互动产品6个月前02.8K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具,旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型(LLM),通过命令行或桌面应用接口与用户互动。Goose可以执行从代...最新AI资源# AI开源项目# AI编程# 智能体开发框架6个月前04K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.3K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码综合介绍 Onlook是一款开源的设计工具,专为设计师和开发者打造,允许用户直接在运行的React应用中进行设计,并将设计修改转换为代码。该工具提供了一种直观的视觉编辑体验,类似于Figma或Webf...最新AI资源# AI开源项目# AI页面设计6个月前02.4K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐6个月前03.3K
PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具综合介绍 PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用...最新AI资源# AI开源项目# AI本地化聊天应用6个月前06.3K
Cog-ComfyUI:使用API运行ComfyUI工作流综合介绍 Cog-ComfyUI是一个开源项目,旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建,提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI6个月前02.8K
Supermemory:导入书签和网页内容构建个人知识库综合介绍 Supermemory 是一个开源项目,旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术,让用户能够轻松保存、组织和检索来自网页、Twitter书签...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前02.9K
Open NotebookLM:将PDF转换为播客的开源工具综合介绍 Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话...最新AI资源# AI开源项目# AI文本转语音6个月前02.7K
Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型综合介绍 Qwen2.5-VL 是阿里巴巴云(Alibaba Cloud)Qwen 团队开发的开源多模态大模型。它能同时处理文本、图像、视频和文档,是 Qwen2-VL 的升级版,基于 Qwen2.5...最新AI资源# AI开源项目5个月前02.7K
Lux:几乎支持所有视频平台的命令行视频下载器综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频,包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能,如多线程下载...最新AI资源# AI开源项目6个月前02.2K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI资源# AI开源项目6个月前03.5K
Langui:开源的AI用户界面组件库综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...最新AI资源# AI开源项目# AI页面设计7个月前02.4K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用综合介绍 MNN(Mobile Neural Network)是阿里巴巴开发的一个高效、轻量级的深度学习框架,专为移动端设备优化。MNN不仅能够在移动设备上进行快速推理,还支持多模态任务,包括文本生成...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.3K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具综合介绍 AI RSS是一个创新的工具,通过AI技术将网页内容转换为RSS订阅源。它包含两个主要部分:一个浏览器插件和一个服务器端。浏览器插件允许用户选择网页中的列表并生成结构化数据描述(SDD)文件...最新AI资源# AI开源项目# AI生活效率助手7个月前02.6K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调综合介绍 UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG(检索增强生成)系统解决方案。该框架基于敏捷部署和模块化构建...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前02.2K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆6个月前03.2K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前02.4K
TinyZero:低成本复现 DeepSeeK-R1 Zero 的顿悟效果综合介绍 TinyZero 是一个基于 veRL 的强化学习模型,旨在复现 DeepSeeK-R1 Zero 在倒计时和乘法任务中的表现。令人惊讶的是,该项目仅需 30 美元的运行成本(使用 2xH2...最新AI资源# AI开源项目7个月前03.9K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程综合介绍 Hugging Face的Open R1项目是一个完全开源的DeepSeek-R1复现项目,旨在构建R1管道的缺失部分,使每个人都能复现并在其基础上进行构建。该项目设计简单,主要包括训练和评...最新AI资源# AI开源项目7个月前04.1K
Open Operator:通过AI智能体在云浏览器中执行自动化操作综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...最新AI资源# AI开源项目# 桌面自动化智能体7个月前03.6K
Cerebr:与网页内容对话的开源浏览器插件综合介绍 Cerebr 是一个功能强大的 Chrome 浏览器 AI 助手扩展,旨在提升用户的工作效率和学习体验。Cerebr 的设计理念源于对简洁、高效浏览器 AI 助手的需求,凭借其极简设计和强大...最新AI资源# AI开源项目# 浏览器AI助手4个月前02.6K