
Ovis:视觉与文本对齐模型,精准反推图像提示词
综合介绍 Ovis(Open VISion)是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型(MLLM),托管于 GitHub。该模型采用创新的结构嵌入对齐技术,将视觉和文本数据高效融合,支持图像、...
综合介绍 Ovis(Open VISion)是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型(MLLM),托管于 GitHub。该模型采用创新的结构嵌入对齐技术,将视觉和文本数据高效融合,支持图像、...
综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发,专注于构建...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架,旨在成为大模型(LLM)应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架的优秀设计,结合前沿研究成果和字节跳动内部实践经...
综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM)智能体的推理与决策能力,基于Deepseek-R1、QwQ-32B...
综合介绍 ANUS(Advanced Neural Understanding System,高级神经理解系统)是一个托管在 GitHub 上的开源 AI 代理框架,由用户 nikmcfly 通过提示 Manus AI 完全生成。它旨在为开发者、研究者和 AI 爱好者提供一...
综合介绍 Long-VITA 是由 VITA-MLLM 团队开发的一款开源多模态大模型,专注于处理超长上下文的视觉和语言任务。它能够同时分析图像、视频和文本,支持高达 100 万 token 的输入,适用于视频理解、高分辨率图像解...
综合介绍 Chikka 是一个利用人工智能技术进行用户访谈和洞察收集的在线平台。它通过智能语音助手 Ava,帮助用户快速设计访谈提纲、执行大规模个性化访谈,并自动分析访谈结果,挖掘隐藏的主题和建议。无论是企业...
综合介绍 Meeting Minutes(又名 Meetily)是由 Zackriya Solutions 开发的一款免费开源的 AI 会议助手工具,专注于实时捕获会议音频、生成转录文本并自动提取会议摘要。该工具完全在本地设备上运行,支持 macOS ...
综合介绍 HyperChat 是一个由 BigSweetPotatoStudio 开发的开源聊天客户端,托管于 GitHub,旨在通过集成多个大型语言模型(LLM)的 API(如 OpenAI、Claude、Qwen 等)提供高效的聊天体验,同时利用 MCP(Model ...
综合介绍 Prose 是一个专注于提升写作效率与质量的人工智能工具,旨在帮助用户将普通文本转化为更流畅、更专业的表达。无论你是学生、职场人士还是内容创作者,这个网站都能通过先进的语法检查、拼写纠正以及AI驱...
综合介绍 Chat2DB 是一款由 CodePhiliaX 团队开发的开源数据库管理和SQL客户端工具,集成了AI功能,支持快速编写SQL查询、管理数据库、生成数据报表以及多数据库交互。它支持超过16种主流数据库,包括 MySQL、Pos...
综合介绍 Local-NotebookLM 是一个开源项目,旨在提供本地运行的智能文档处理与内容生成工具。它受到 Google NotebookLM 的启发,专注于帮助用户将 PDF 等文档转化为多种输出格式,如播客、访谈或讲座等,同时支...
综合介绍 Tometo AI 是一个专为初创公司和分布式团队打造的智能工具,通过自动化任务分配和进度管理提升项目执行效率。它借鉴 FAANG(谷歌、亚马逊等顶级科技公司)的管理经验,利用 AI 技术自动拆分任务、分配资...
综合介绍 ResumeUp.AI 是一个专为求职者打造的AI平台,帮助用户快速生成专业简历,确保简历能顺利通过招聘软件的筛选,同时提供求职全程的实用工具。网站通过智能简历生成、简历检查和求职管理功能,解决简历被自...
综合介绍 AkashChat 是一个基于去中心化云计算的AI聊天平台,由 Akash Network 开发并支持。它利用NVIDIA GPU提供的高性能算力,运行多个开源大语言模型(如QwQ-32B、Llama 3.3 70B、Llama 3.1 405B、DeepSeek R1...
综合介绍 Highlight AI 是一款桌面人工智能助手,支持 Windows 和 macOS(移动版开发中),通过语音指令和屏幕内容分析,帮助用户在任意应用中快速完成任务。它能捕获屏幕内容、生成代码、回答问题,并与 GitHub...
综合介绍 MegaPairs 是 VectorSpaceLab 团队在 GitHub 上开源的项目,通过大规模数据合成技术生成多模态嵌入模型,用于图像-文本到图像的检索任务。项目基于超过2600万个异构 KNN 三元组数据集,训练了 BGE-VL 系...
综合介绍 LitServe 是 Lightning AI 推出的一款开源 AI 模型服务引擎,基于 FastAPI 构建,专注于快速部署通用 AI 模型的推理服务。它支持从大型语言模型(LLM)、视觉模型、音频模型到经典机器学习模型的广泛场...
综合介绍 LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上,扩展了法律领域专有词表,并通...