LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言综合介绍 LiberSonora,寓意“自由的声音”,是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能,能够在GPU加速下进行批量离线处理。LiberSo...最新AI资源# AI开源项目# AI翻译# AI语音转文本8个月前021.7K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统,基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应,支持自然流畅的实...最新AI资源# AI开源项目# 多模态实时互动产品9个月前021.7K
基于Workers AI免费将多种文件转为Markdown格式综合介绍 serverless-markdown-convertor 是一个免费的开源工具,基于 Cloudflare Worker 和 Workers AI 开发,能将多种文件转换为 Markdow...最新AI资源# AI开源项目# 文档提取与清洗7个月前021.7K
self.so:一键生成精美的个人简历网页综合介绍 self.so 是一个开源工具,专为快速将简历或 LinkedIn 个人资料转化为个人网站而设计。用户只需上传 PDF 简历或输入 LinkedIn 链接,系统通过 AI 技术(基于 Tog...最新AI资源# AI开源项目# AI生活效率助手6个月前021.7K
zChunk:基于Llama-70B的通用语义分块策略综合介绍 zChunk是由ZeroEntropy开发的一种新型分块策略,旨在为通用语义分块提供解决方案。该策略基于Llama-70B模型,通过提示生成分块,优化了文档的分块过程,确保在信息检索时保持高...最新AI资源# AI开源项目# 文档提取与清洗8个月前021.7K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询综合介绍 SQLite-Utils-Ask 是一个强大的工具,旨在通过LLM(大语言模型)的辅助,帮助用户对SQLite数据库和CSV/JSON文件进行问答式数据查询。该工具能够根据用户的问题自动生成...最新AI资源# AI开源项目# AI数据分析11个月前021.7K
Paper to Podcast:把学术论文转换为多人对话播客综合介绍 Paper to Podcast 是一个开源工具,专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术,将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话,让复杂的...最新AI资源# AI开源项目# AI文本转语音7个月前021.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具...最新AI资源# AI开源项目# 文档提取与清洗8个月前021.7K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频综合介绍 视频制作AI工具包(Video Starter Kit)是由fal-ai-community发布的一个开源项目,旨在展示如何在浏览器中利用AI模型进行视频制作。它提供了从图像到视频的转换工具...最新AI资源# AI开源项目# AI音视频编辑9个月前021.7K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库综合介绍 Languine 是一个由 Midday 开发的强大翻译工具,旨在帮助开发者简化应用程序的本地化过程。通过 Languine,开发者可以利用 AI 技术快速生成准确且符合上下文的翻译,支持超...最新AI资源# AI开源项目# AI翻译10个月前021.7K
par_scrape:智能提取网页数据的爬虫工具综合介绍 par_scrape 是一个基于 Python 的开源网页爬虫工具,由开发者 Paul Robello 在 GitHub 上推出,旨在帮助用户从网页中智能提取数据。它整合了 Selenium...最新AI资源# AI开源项目# 文档提取与清洗8个月前021.7K
Text2Voice:基于硅基流动API的文本转语音图形界面综合介绍 Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让...最新AI资源# AI开源项目# AI文本转语音6个月前021.6K
VideoGrain:文本提示对视频进行局部编辑的开源项目综合介绍 VideoGrain 是一个专注于多粒度视频编辑的开源项目,由 xAI 团队开发并在 GitHub 上托管。这个项目出自论文《VideoGrain: Modulating Space-Tim...最新AI资源# AI开源项目# AI音视频编辑8个月前021.6K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件综合介绍 Artab 是一个浏览器扩展程序,旨在每次打开新标签页时展示世界上最伟大的艺术作品。该扩展程序适用于 Chrome、Edge 和 Firefox 浏览器。通过 Artab,用户可以在日常浏览...最新AI资源# AI开源项目10个月前021.6K
Airweave:让应用程序快速集成知识库,实现智能搜索综合介绍 Airweave 是一个开源工具,旨在通过同步用户的应用数据、API、数据库和网站到图谱和向量数据库,使任何应用程序变得可搜索。Airweave 简化了数据可搜索化的过程,无论是结构化数据还...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前021.6K
codemcp:Claude Desktop专用的编码助手MCP综合介绍 codemcp 是一个开源工具,专为 Claude Desktop 用户设计,由 Edward Z. Yang 在 GitHub 上开发。它能让 Claude Desktop 成为一个实用的...最新AI资源# AI开源项目# AI编程# MCP服务7个月前021.6K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。综合介绍 Inbox Zero 是一个开源的邮件管理应用,旨在通过 AI 助手帮助用户快速实现收件箱零邮件。该应用提供了多种功能,包括自动回复、归档、标签和转发邮件,管理和退订新闻通讯,阻止冷邮件,跟...最新AI资源# AI开源项目# AI生活效率助手10个月前021.6K
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI资源# AI开源项目# OCR6个月前021.6K
DeepResearcher:基于强化学习驱动AI研究复杂问题综合介绍 DeepResearcher 是由上海交通大学 GAIR-NLP 团队开发的开源项目。它是一个基于大型语言模型(LLM)的智能研究工具,通过强化学习(RL)在真实网络环境中进行端到端训练。项...最新AI资源# AI开源项目# 生成深度研究报告6个月前021.6K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)综合介绍 GenEx 是一个先进的人工智能模型,能够从单张图像生成一个完全可探索的360° 3D世界。用户可以交互式地探索这个生成的世界。GenEx 推动了具象化人工智能在想象空间中的发展,并有潜力将...最新AI资源# AI开源项目# AI文本与图片转3D10个月前021.6K
DeepGemini:多模型编排任务并封装为API接口综合介绍 DeepGemini 是一个开源项目,由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具,主要特点是能灵活组合多种 AI 模型,并通过 OpenAI 兼容...最新AI资源# AI开源项目4个月前021.6K
MiniMind-V:1小时训练26M参数视觉语言模型综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...最新AI资源# AI开源项目# 大模型微调6个月前021.6K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。综合介绍 FlipSketch 是一个开源项目,旨在将静态绘图转换为文本引导的动画。该项目托管在 GitHub 上,提供了一个创新的工具,允许用户通过文本描述来生成动画效果。FlipSketch 结合...最新AI资源# AI图像转视频# AI开源项目11个月前021.6K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面综合介绍 GLIGEN GUI 是一个基于 ComfyUI 的直观图形界面,旨在简化 GLIGEN 模型的使用。GLIGEN 是一种新颖的文本到图像模型,可以精确指定图像中对象的位置。通过 GLIGE...最新AI资源# AI图像生成辅助工具# AI开源项目1年前021.5K
openai-captcha-detection:使用 OpenAI 进行验证码识别的高效工具。综合介绍 openai-captcha-detection 是一个使用 OpenAI 进行验证码识别的工具。通过调用 OpenAI 的 API,这个项目可以实现对复杂验证码图片的文本识别,帮助开发者在...最新AI资源# AI开源项目11个月前021.5K
Scraperr:自托管网页数据抓取工具综合介绍 Scraperr 是一个自托管的网页数据抓取工具,用户可以通过指定 XPath 元素来抓取网页数据。用户提交 URL 和相应的抓取元素,结果将显示在表格中,并可下载为 Excel 文件。Sc...最新AI资源# AI开源项目11个月前021.5K
Lecca:无代码构建AI智能体与AI工作流构建平台综合介绍 Lecca 是一个强大的AI平台,允许用户配置和部署大语言模型(LLMs),并配备多种工具和工作流。用户可以轻松构建、定制和自动化他们的AI代理。Lecca 提供了多种AI提供商和模型选择...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架7个月前021.5K
检测MCP服务安全风险的开源工具综合介绍 mcp-is-dangerous 是 Shaojie Jiang 在 GitHub 上开发的一个开源工具。它通过简单的 Python 代码,帮助用户检测 MCP(Model Context ...最新AI资源# AI开源项目# MCP服务7个月前021.5K
Deep Searcher:企业私有文档高效检索与智能问答综合介绍 Deep Searcher 是一个结合强大大语言模型(如 DeepSeek 和 OpenAI)和向量数据库(如 Milvus)的工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前021.5K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架综合介绍 Chitu 是一个由清华大学 PACMAN 团队开发的开源推理框架,全名叫“赤兔”,专门用来跑大语言模型。它主打高效、灵活和实用,能让企业在不同设备上快速部署大模型。Chitu 支持多种硬件...最新AI资源# AI开源项目7个月前021.4K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐综合介绍 DisPose是一个创新的开源人工智能项目,专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源,采用先进的深度学习技术,通过分解骨骼姿态信息来实现精确的人物动画控制。D...最新AI资源# AI图像转视频# AI开源项目10个月前021.4K
Swarms:多智能体编排框架,企业级生产工具综合介绍 Swarms是一个企业级生产就绪的多代理编排框架,旨在通过高效的代理管理和任务处理来提升企业生产力。该框架支持多模型、多内存系统和自定义代理创建,提供了模块化设计和全面的日志记录功能,确保系...最新AI资源# AI开源项目# 智能体开发框架10个月前021.4K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据综合介绍 观察者(Observers)是一个开源的Python SDK,旨在为生成式AI API提供全面的可观测性。该库使用户能够轻松跟踪和记录与AI模型的交互,并将这些观察结果存储在多个后端中。无论...最新AI资源# AI开源项目10个月前021.4K
R1-Omni:通过视频和音频分析情感的开源模型综合介绍 R1-Omni 是 HumanMLLM 团队在 GitHub 上推出的开源项目。它首次将强化学习与可验证奖励(RLVR)技术应用于多模态大语言模型,专注于情感识别。项目通过分析视频和音频数据...最新AI资源# AI开源项目7个月前021.4K
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具综合介绍 Find My Kids 是一个开源项目,托管在 GitHub 上,由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...最新AI资源# AI开源项目# 视觉目标检测6个月前021.4K
VOP:提取复杂图表与数学公式的OCR工具综合介绍 Versatile OCR Program 是一个开源的光学字符识别(OCR)工具,专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图,并生...最新AI资源# AI开源项目# OCR# 文档提取与清洗6个月前021.4K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面综合介绍 AgentClientDemo 是一个集成了智能体(Agent)和客户端(Client)功能的综合性 Python 项目。该项目基于 PyQt 框架开发,提供了一个直观易用的图形用户界面(G...最新AI资源# AI开源项目# 智能体开发框架10个月前021.3K
OpenSumi Lite:纯前端IDE解决方案,轻松实现代码查看与编辑综合介绍 OpenSumi Lite 是一个基于 OpenSumi 项目的纯前端 IDE 解决方案,旨在提供无需 Node.js 环境的代码查看与编辑功能。该项目由阿里巴巴集团和蚂蚁集团共同开发,采用...AI答疑# AI开源项目8个月前021.3K
II-Researcher:深度搜索与分步推理解答复杂问题综合介绍 II-Researcher 是 Intelligent-Internet 团队开发的一款开源人工智能研究工具,托管于 GitHub。它专为深度搜索和复杂推理设计,能通过智能网页搜索和多步骤分...最新AI资源# AI开源项目# 生成深度研究报告7个月前021.3K
元界AI:开源版AI数字人克隆与短视频生成工具综合介绍 元界AI(开源版)是一个托管在 GitHub 上的项目,,由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音,生成短视频,还支持配音和字幕制作。这个工具提供 Windo...最新AI资源# AI副业赚钱项目# AI开源项目# AI数字人7个月前021.3K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件综合介绍 MJML(邮件界标记语言)是由 Mailjet 团队开发的一个开源框架,旨在简化响应式邮件模板的创建。通过语义化的标记语言和丰富的组件库,开发者可以用更少的代码高效创建美观且功能强大的电子邮...最新AI资源# AI开源项目1年前021.3K
基于Cloudflare Worker的AI图片生成脚本综合介绍 CloudFlare-AI-Image 是一个开源项目,托管在 GitHub 上,通过 Cloudflare Workers 平台提供免费的 AI 图像生成服务。它支持文生图和图生图功能,基...最新AI资源# AI开源项目# 免费大模型API6个月前021.3K
Audio-Reasoner:支持音频深度推理的大型语言模型综合介绍 Audio-Reasoner 是由清华大学团队开发并托管于 GitHub 的开源项目,专注于构建支持音频深度推理的大型语言模型。该模型基于 Qwen2-Audio-Instruct,通过引入...最新AI资源# AI开源项目7个月前021.3K
Potpie AI:快速创建专属代码库的AI工程助手综合介绍 Potpie AI 是一个开源平台,专注于为开发者提供定制化的AI工程助手。它通过构建代码库的知识图谱,让AI代理深入理解代码结构与逻辑,自动化完成调试、测试、代码生成等任务。用户可以用简单...最新AI资源# AI开源项目# AI编程6个月前021.3K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台综合介绍 AI 蜂巢(ai-beehive)是一个基于 Java 语言,采用 Spring Boot 3 和 JDK 17 构建的多功能 AI 平台。该项目整合了多种 AI 技术,包括 ChatGPT...最新AI资源# AI副业赚钱项目# AI开源项目# AI本地化聊天应用12个月前021.3K
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型,基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...最新AI资源# AI开源项目8个月前021.3K
Agenta:集成到AI应用的提示词与模型效果评估工具综合介绍 Agenta 是一个开源的AI模型管理工具,专门帮助用户轻松实验提示词、测试模型效果和监控运行情况。它适合想快速开发AI应用的人,提供了一个简单操作的平台。你可以用它试试不同提示词的效果,对...最新AI资源# AI开源项目# PROMPTS辅助工具7个月前021.3K
茴香豆:基于LLM(大型语言模型) 的群聊助手综合介绍 HuixiangDou 是一个基于大型语言模型(LLM)的群聊助手,旨在通过三阶段的预处理、拒绝和响应流程来应对群聊场景。它能够在不造成信息泛滥的情况下回答用户问题。该项目提供了完整的Web...最新AI资源# AI开源项目8个月前021.2K
MTranServer:CPU即可运行的离线翻译服务综合介绍 MTranServer 是一个专注于离线翻译的开源服务器项目,托管于 GitHub,由开发者 xxnuo 创建。它最大的亮点是超低的资源需求,仅需 CPU 和 1GB 内存即可运行,无需 G...最新AI资源# AI开源项目# AI翻译7个月前021.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作综合介绍 ClickClickClick是一个由BandarLabs开发的框架,旨在通过使用任何本地或远程的大型语言模型(LLM)实现安卓和电脑的自动化操作。该项目目前处于高度实验阶段,支持多种模型如...最新AI资源# AI开源项目# 桌面自动化智能体10个月前021.2K
让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展,旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid...最新AI资源# AI开源项目8个月前021.2K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)综合介绍 3FS(Fire-Flyer File System)是由DeepSeek团队开发的一款开源并行文件系统,专为现代SSD和RDMA网络设计,旨在大幅提升数据访问效率。它在180节点集群中实现...最新AI资源# AI开源项目8个月前021.2K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染综合介绍 Extract.fun 是一个现代化的Web应用程序,利用Cloudflare浏览器渲染功能从任何网站提取图片。该应用基于Remix构建,并部署在Cloudflare Pages上,提供快速...最新AI资源# AI开源项目11个月前021.2K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)综合介绍 DualPipe 是由 DeepSeek-AI 团队开发的一项开源技术,专注于提升大规模 AI 模型训练的效率。它是一个创新的双向流水线并行算法,主要用于在 DeepSeek-V3 和 R1...最新AI资源# AI开源项目8个月前021.1K
VACE:视频创作和编辑的开源模型(未开放)综合介绍 VACE 是由阿里通义视觉智能实验室(ali-vilab)开发的一个开源项目,专注于视频创作与编辑。它是一个全能型工具,集成了多种功能,比如根据参考生成视频、编辑已有视频内容、本地化修改等...最新AI资源# AI开源项目# AI音视频编辑7个月前021.1K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型综合介绍 Omnitool.ai 是一个开源的“AI实验室”,旨在为学习者、爱好者和对当前AI创新感兴趣的任何人提供一个可扩展的浏览器桌面环境。它允许用户通过一个统一的界面与来自OpenAI、repl...最新AI资源# AI开源项目8个月前021.1K
DragAnything:对图像中实体对象控制运动硅基生成视频综合介绍 DragAnything 是一个开源项目,旨在通过实体表示实现任意对象的运动控制。该项目由 Showlab 团队开发,并已被 ECCV 2024 接收。DragAnything 提供了一种用...最新AI资源# AI图像转视频# AI开源项目8个月前021.1K
Aana SDK:简易部署多模态AI模型的开源工具综合介绍 Aana SDK 是一个开源框架,由 Mobius Labs 开发,名字源于马拉雅拉姆语“ആന”(大象)。它帮助开发者快速部署和管理多模态 AI 模型,支持处理文本、图像、音频和视频等多种数...最新AI资源# AI开源项目# 本地部署开源大模型工具7个月前021.1K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告综合介绍 OpenDeepResearcher 是一个开源的自动化深度研究工具,旨在通过人工智能技术提升研究效率。该项目由 mshumer 开发,托管在 GitHub 上。OpenDeepResear...最新AI资源# AI开源项目# 生成深度研究报告7个月前021.1K
Shadowfetch:Cloudflare Workers 匿名代理大模型API综合介绍 Shadowfetch 是一个专为 Cloudflare Workers 设计的轻量级开源工具,由开发者 tysak 在 GitHub 上维护,采用 AGPL v3 许可证发布。它通过原生 ...最新AI资源# AI开源项目8个月前021.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件综合介绍 WordPress AI助手插件(wp-ai-chat)是一个开源的WordPress插件,旨在为用户提供多种AI功能,包括AI对话、文章生成、文章总结、文章翻译和内容朗读。该插件支持对接多...最新AI资源# AI写作# AI开源项目8个月前021.1K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具综合介绍 OpenSearch-SQL 是一个开源项目,它是一个强大的 Text-to-SQL 工具,可以把用户的自然语言描述转化为 SQL 查询语句,帮助不熟悉数据库的人轻松获取数据。这个项目由 O...最新AI资源# AI开源项目# AI数据分析7个月前021K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案综合介绍 OpenAlternative 是一个专注于提供开源软件替代方案的平台,旨在帮助用户找到适合的开源工具来替代日常使用的商业SaaS产品。该网站通过精心策划的开源工具集合,帮助用户节省成本并提...最新AI资源# AI开源项目10个月前021K
Llama 3.2 Reasoning WebGPU:在浏览器中运行LLama-3.2综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库,旨在将最先进的机器学习模型直接在浏览器中运行,无需服务器支持。该库与 Hugging Fa...AI新闻# AI开源项目# 本地部署开源大模型工具9个月前021K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等综合介绍 报告生成工具(Report mAIstro)是一个强大的工具,旨在通过自然语言处理技术,帮助用户轻松创建自定义报告。该工具利用LangChain技术,将用户提供的主题和结构转化为详细的报告内...最新AI资源# AI开源项目# 生成深度研究报告7个月前021K
PilottAI:构建企业级多智能体应用的开源项目综合介绍 PilottAI 是一个开源的 Python 框架,托管在 GitHub 上,由开发者 anuj0456 创建。它专注于帮助用户构建企业级的多智能体系统,支持大语言模型(LLM)集成,提供任...最新AI资源# AI开源项目# 智能体开发框架7个月前021K
JupyterLab Magic Wand:在JupyterLab中使用AI助手提升工作效率综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展,旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发,主要用于提升数据科学家和...最新AI资源# AI开源项目9个月前021K
Long-VITA:支持超长上下文输出的视觉语言模型综合介绍 Long-VITA 是由 VITA-MLLM 团队开发的一款开源多模态大模型,专注于处理超长上下文的视觉和语言任务。它能够同时分析图像、视频和文本,支持高达 100 万 token 的输入...最新AI资源# AI开源项目7个月前021K
Xata Agent:监控和优化PostgreSQL数据库的AI助手综合介绍 Xata Agent 是一个开源的AI工具,专门为PostgreSQL数据库设计。它能自动监控数据库运行状态,发现性能问题或故障的根本原因,并给出修复建议。开发团队xAI将其定位为一个类似...最新AI资源# AI开源项目# AI数据分析7个月前021K
混元Turbo S:腾讯推出的快思考大模型(开放申请)综合介绍 腾讯混元Turbo S是腾讯自研的新一代快思考大模型,已在腾讯云官网上线,并于2025年2月27日正式发布。它与传统的慢思考模型(如Deepseek R1、混元T1)不同,能实现“秒回”,吐...最新AI资源# AI开源项目7个月前020.9K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVID...AI新闻# AI开源项目# AI文本转语音8个月前020.9K
LineAvatars:生成 Notion 风格线条头像的免费工具综合介绍 LineAvatars 是一个免费且简单易用的在线工具,专门用于生成 Notion 风格的线条头像。用户可以上传照片或通过摄像头拍摄一张照片,系统会使用 AI 自动生成一个线条头像。这个工具...最新AI资源# AI图像风格控制# AI开源项目8个月前020.9K
Instructor:简化大语言模型结构化输出工作流的Python库综合介绍 Instructor 是一个流行的 Python 库,专为处理大语言模型(LLMs)的结构化输出而设计。它基于 Pydantic 构建,提供了一个简单、透明且用户友好的 API,用于管理数据...最新AI资源# AI开源项目# 文档提取与清洗8个月前020.9K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求...最新AI资源# AI图像转视频# AI开源项目8个月前020.9K
openapi-mcp-server:让AI直接调用开放API的MCP服务综合介绍 openapi-mcp-server 是一个开源工具,旨在将符合 OpenAPI v3.1 标准的API转化为AI可用的资源。它由 janwilmake 维护,基于 Model Contex...最新AI资源# AI开源项目# MCP服务7个月前020.8K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)综合介绍 OpenAI Realtime Agents是一个开源项目,旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式(借鉴 OpenAI Swarm),允许...最新AI资源# AI开源项目# 多模态实时互动产品9个月前020.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown综合介绍 magic-html是一个Python库,旨在简化从HTML中提取主体区域内容的过程。无论处理的是复杂的HTML结构还是简单的网页,这个库都旨在为用户提供一个便捷高效的接口。它支持多模态抽取...最新AI资源# AI开源项目1年前020.8K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目,旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型(LLM...最新AI资源# AI开源项目# AI教育工具8个月前020.8K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能综合介绍 Deep Research是一个基于AI的研究助手,旨在通过结合搜索引擎、网页抓取和大语言模型,进行迭代的深度研究。该项目由dzhng在GitHub上发布,目标是提供一个简单易用的深度研究代...最新AI资源# AI开源项目# 生成深度研究报告7个月前020.8K
Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...最新AI资源# AI开源项目# 文档提取与清洗10个月前020.8K
UIGEN-T1-Qwen-7b:生成HTML和CSS UI组件的专用模型综合介绍 UIGEN-T1 是一个拥有 70 亿参数的 Transformer 模型,它基于 Qwen2.5-Coder-7B-Instruct 进行微调,专为基于推理的 UI 生成而设计。它利用复杂...最新AI资源# AI开源项目8个月前020.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式综合介绍 QuickPiperAudiobook 是一个开源项目,旨在通过简单的一条命令,将各种文本格式(如 epub、mobi、txt、PDF、HTML 等)转换为自然音质的有声书。该工具使用 Pi...最新AI资源# AI开源项目# AI文本转语音1年前020.8K
Local Deep Research:本地运行的生成深度研究报告工具综合介绍 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具...最新AI资源# AI开源项目# 生成深度研究报告5个月前020.8K
AiryLark:支持多格式文档智能翻译的开源工具综合介绍 AiryLark 是一个开源的文档处理与翻译工具,托管在 GitHub 上,由开发者 wizd 基于 Next.js 框架打造。它支持多种文件格式(如 PDF、Word、TXT、Markdo...最新AI资源# AI开源项目# AI翻译6个月前020.8K
Azure TTS Importer:将语音合成服务集成到阅读软件中综合介绍 TTS Importer 是一个开源项目,旨在将 Azure TTS(Text-to-Speech)语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件,包括阅读(legado...最新AI资源# AI开源项目# AI文本转语音8个月前020.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具综合介绍 CoT-Lab(人机协同思维实验室)是一个探索人机协作新范式的实验性界面。基于认知负荷理论和主动学习原则,CoT-Lab 通过创建“思维伙伴”关系,促进人类与人工智能的深度认知对齐。该项目旨...最新AI资源# AI开源项目8个月前020.7K
CleverBee:开源AI研究助手,生成引证研究报告综合介绍 CleverBee 是一个开源的 AI 研究助手,托管在 GitHub 上,由 SureScaleAI 开发。它通过大语言模型(如 Gemini 和 Claude)结合网页浏览技术,帮助用户...最新AI资源# AI开源项目# 生成深度研究报告5个月前020.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集综合介绍 AI Agent Service Toolkit 是一个基于LangGraph、FastAPI和Streamlit构建的完整工具集,旨在帮助开发者快速构建和运行AI代理服务。该工具包提供了一...最新AI资源# AI开源项目# 智能体开发框架9个月前020.7K
DeepCoder-14B-Preview:擅长代码生成的的开源模型综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...最新AI资源# AI开源项目# 大模型微调6个月前020.7K
Zev:用自然语言快速查询终端命令的CLI工具综合介绍 Zev 是一个简单易用的命令行界面(CLI)工具,帮助用户通过自然语言快速查询和生成终端命令。用户无需记住复杂的命令语法,只需用日常语言描述需求,Zev 就能生成对应的终端命令。基于 Ope...最新AI资源# AI开源项目6个月前020.7K
Agentic Radar:对 Agentic 工作流安全检测的可视化工具综合介绍 Agentic Radar 是 SplxAI 推出的一款开源工具,专为扫描和保护基于大模型(LLM)的 AI 工作流设计。它通过分析代码,生成清晰的工作流图和安全报告,帮助开发者、安全专家快...最新AI资源# AI开源项目7个月前020.7K
HumanOmni:分析人类视频情感和动作的多模态大模型综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 2...最新AI资源# AI开源项目# 视觉目标检测7个月前020.7K
AgentIQ:灵活连接和管理AI智能体的开源工具综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具,旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作,连接企业数据和工具,像调用函数一样构建工作流。这个工具的最大...最新AI资源# AI开源项目# 智能体开发框架7个月前020.7K
Translation Agent WebUI:吴恩达翻译智能体界面版,提供多种翻译API和Gradio界面综合介绍 Translation Agent WebUI 是一个基于 Gradio 的网页用户界面,专为 Andrewyng 的翻译代理(translation-agent)设计。该工具能够自动检测输...最新AI资源# AI开源项目# AI翻译10个月前020.7K
Free-Search:免费获取实时谷歌搜索结果的API工具综合介绍 Free-Search 是一个由 Hanzla Javaid 开发的开源 API 工具,托管在 GitHub 上。它的主要功能是通过自定义搜索引擎提供实时的谷歌搜索结果,并爬取网页内容返回结...最新AI资源# AI开源项目7个月前020.6K
LettuceDetect:检测RAG系统幻觉的高效工具综合介绍 LettuceDetect 是 KRLabsOrg 开发的一个轻量级开源工具,专门用于检测检索增强生成(RAG)系统中生成的幻觉内容。它通过对比上下文、问题和回答,识别回答中不受上下文支持的...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前020.5K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话综合介绍 Qwen4Mac是一个开源项目,旨在将Qwen大语言模型(LLM)集成到Mac的菜单栏中,方便用户随时调用和使用。该项目由andreaturchet开发和维护,提供了一种简便的方式,让用户能...最新AI资源# AI开源项目8个月前020.4K
Foudinge Scrub:从餐厅评论中构建知识图谱综合介绍 Foudinge Scrub 是一个开源的网页工具,托管在 GitHub 上,由开发者 Théophile Cantelobre 创建。它旨在帮助用户清理和编辑从复杂文本数据中提取的知识图谱...最新AI资源# AI开源项目7个月前020.4K
Rowfill:批量提取文档结构化信息并自动化分析综合介绍 Rowfill 是一个开源的文档处理平台,专为知识工作者设计。它利用先进的人工智能技术,从复杂的文档、图像和PDF中提取、分析和处理数据。Rowfill 支持本地大语言模型(LLM)和Ope...最新AI资源# AI开源项目# AI数据分析# 文档提取与清洗8个月前020.4K