Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

30.4K 00

为您的私有和公共数据提供更精准、更灵活且支持多模态的知识代理。Activeloop 的 Deep Thinking 技术现已全面开放。

展望 2025 年，生成式 AI (GenAI) 将迎来投资回报率 (ROI) 的关键之年。而基于多模态数据的知识代理，正是实现这一目标的核心驱动力。

构建 Deep Research 的初衷

在过去一年中，Activeloop 团队与众多企业，特别是财富 500 强公司进行了深入交流。他们发现了一个普遍存在的趋势：企业用户在性能延迟方面展现出一定的容忍度，但对准确性的降低却绝不妥协。事实上，数据检索的准确性已成为不可逾越的底线，它直接关系到企业能否借助生成式 AI 真正提升营收或效率，并以此证明在额外基础设施及模型上的巨额投入是物有所值的。

知识工作者们每天都耗费大量时间在重复且高度依赖人工的搜索工作上：从护士整理患者的健康数据以进行保险索赔审核，到律师助理为专利申请进行详尽的专利检索，再到研究人员评估 PubMed 上新发表的论文，以验证化合物假设。

保守估计显示，企业内部的人工搜索行为导致了约 21.3% 至 25% 的生产力浪费。这相当于每位员工每年损失约 2 万美元。对于一家拥有 1000 名员工的中型企业而言，低效的搜索每年可能造成超过 2000 万美元 的经济损失。试想一下，每当您的团队成员花费时间去搜寻那些“失踪”的文件时，就如同您在付费让他们与企业数据玩一场“捉迷藏”游戏，最终却无人能从中获益。

今天，Activeloop 隆重推出一项创新解决方案，旨在彻底解决上述难题—— 这便是 AI 知识代理，它能够基于企业内外部的多模态数据，生成高度精准且经过深入分析的答案。

OpenAI Deep Research 的对比

Deep Lake 与 OpenAI 的 Deep Research，二者均致力于增强 AI 驱动的研究与检索能力，但它们在实现路径上却选择了截然不同的方法。OpenAI 的 Deep Research 侧重于构建一个 AI 驱动的助手，使其能够自主地在互联网上进行信息搜索。而 Deep Lake 则定位于提供 企业级、多模态 AI 检索系统，能够与 公共及私有数据 实现无缝对接。在用户可以提问的数据类型，以及检索结果的 准确性 乃至 灵活性 方面，Deep Lake 均展现出 媲美甚至超越 OpenAI Deep Research 的实力。

1. 连接您的私有数据与公共数据

Deep Lake 与 OpenAI Deep Research 之间的一个关键差异在于，Deep Lake 并非仅限于公共数据。它的设计初衷是 服务于企业级用户，特别是那些需要在 专有、敏感且高价值的数据集 上进行 AI 驱动检索的企业。 Activeloop 在其研究中发现，约有 63% 的企业在统一数据并将其与 AI 系统连接时面临挑战。而 Deep Lake 可以即时部署在企业的 Amazon S3 或 Azure 云环境中 (并已在各自的应用市场中上架)，使用户能够立即基于这些数据进行提问和分析。

其部署过程极为简便，如下图所示：

Deep Lake 提出建立在私有多模态数据之上的 Deep Research 方案

尽管 Deep Research 仅限于搜索公开可访问的资源，Deep Lake 却允许企业安全地存储和检索来自其内部研究、报告、知识产权以及机密数据的宝贵洞见。
这对于 生物科技、医疗科技 (MedTech)、金融以及法律等行业 而言至关重要，因为这些行业高度依赖专有信息，而非开放的网络搜索结果。
企业级安全特性 (包括 RBAC 权限管理、SOC 2 Type II 合规性认证、渗透测试等) 确保敏感数据始终处于 合规且受保护 的状态。

2. 基于视觉语言模型的多模态检索

Deep Lake 从底层架构开始便专注于 多模态 AI 检索 功能的构建，这使其在处理 涉及多样化数据类型的复杂任务时更具优势。尽管 Deep Research 主要处理 基于文本的查询 (并具备一定的图像和文件处理能力)，Deep Lake 却能全面支持：

跨文本、图像、视频、音频以及结构化元数据的无缝跨模态查询。
专门为多模态检索优化的微调视觉语言模型 (VLM)，确保即使面对 高度复杂的混合数据查询，系统也能返回准确且高度相关的结果。
实时混合搜索，巧妙融合了基于向量、关键词以及结构化的搜索技术，从而显著提升检索精度。

3. 媲美甚至更卓越的检索准确率

Deep Lake 凭借其 先进的检索架构，确保了其检索结果的 准确性能够比肩，甚至超越 OpenAI 的 Deep Research。相较于主要依赖 测试时推理和思维链过程 的 Deep Research，Deep Lake 创新性地采用了以下技术：

Deep Memory (深度记忆) 技术，通过动态学习用户过往的搜索行为来持续提升检索准确率，并能根据用户的特定用例个性化搜索结果，同时还能学习行业术语和用户偏好。这确保了 Deep Lake 在特定领域用例中能够达到黄金标准般的卓越性能。
多模态检索技术，实现了在 文本、图像、视频、音频以及跨云端和本地存储的结构化数据 之间进行无缝交叉引用。

4. BYOM：自带模型 (Bring-Your-Own-Model)

Deep Lake 不受限于单一模型供应商，而是在底层 AI 模型的选择上提供了 充分的灵活性。

用户可以 灵活地接入其选择的任何模型，包括 最先进的开源模型、微调后的特定领域大语言模型 (LLM) 和小型语言模型 (SLM)，以及其他领先的闭源模型，如 Anthropic Claude 和 Google Gemini。

5. 亚秒级查询与成本优化的性能

自然语言查询会被自动转换为一组 sequel 查询语句。在底层机制上，Activeloop 的系统还会 выяснить ( выяснить 为俄语，已替换为中文：确定 ) 需要查询哪些额外的数据子集，以全面收集支撑高精度回复的证据。

Deep Lake 采用的 lake 上索引 (index-on-the-lake) 技术，支持 直接从对象存储 进行亚秒级查询，相较于传统的内存系统，实现了 高达 10 倍的成本效率提升。这带来了显著的优势：

亚秒级延迟，即使在处理海量数据集 (超过 1 亿条记录) 时也能保持极速响应。
无需昂贵的缓存，查询过程经过深度优化，实现了实时检索，同时维持了较低的存储成本。
可跨云环境弹性扩展，使得 Deep Lake 成为需要快速、经济高效的 AI 搜索 解决方案的 AI 原生应用的上佳之选。

Deep Lake 的工作原理

Deep Lake 专注于数据存储和检索关键组件的构建，旨在为用户提供以最优方式存储和检索数据的能力，从而有力地支撑各类 AI 工作流程。

在连接并索引用户的海量数据之后，Deep Lake 的 知识代理 便能规划出一系列精密的调研任务，并跨越各种数据集和模态执行多步骤查询——准确理解回答用户提出的问题需要哪些关键数据 (更重要的是，判断系统是否掌握能够解答该问题的充分证据)。该知识代理还充分利用了先进的检索技术，例如 MaxSim，以根据视觉和文本的综合上下文进行精准检索，并将检索到的关键信息作为参考文献，连同来自多达数十亿行文本数据的引文一并呈现给用户。

用户可以提出的问题类型

Deep Lake 现已面向所有用户团队成员开放——对用户可以提出的问题数量，以及可以查询的数据规模和模态均不设任何限制。

以下列举了一些用户可以提出的问题类型示例：

综合患者病历数据、实验室测试、核磁共振 (MRI) 报告

查找复杂术语和概念的提及并建立关联

以下示例摘自马塞尔·普鲁斯特的文学巨著《追忆似水年华》(法语：À la recherche du temps perdu) —— 这部作品堪称史上最长的书籍之一，其 PDF 版本超过 1150 页。

跨研究发现进行深度查询

Question: What's the DeepSeek Performance across Reasoning Tasks?

系统给出的答案将包含来自论文文本和图表两方面的信息。

已知局限性

任何系统都不可避免地存在一定的局限性，Deep Lake 亦是如此。在 Activeloop 的实践案例中，Deep Lake 知识代理被调校得更侧重于深度分析，对响应结果持审慎态度。因此，当用户需要即时且简单的答案时，Deep Lake 可能并非最佳选择。但在面对需要更深层次思考的细分领域查询时，Deep Lake 则能展现出其卓越的性能。

目前，Activeloop 正式开放 Deep Lake 系统以进行公开预览，以便根据用户的宝贵反馈持续改进产品。此外，Activeloop 还在积极开发一个智能路由器，该路由器能够根据查询的复杂程度，在“快速”和“慢速”思考模式之间灵活切换，从而进一步优化用户体验。

Flagship Pioneering 如何借助 Deep Lake 在生物技术领域实现突破

Flagship Pioneering 是一家在生物技术领域具有前瞻视野的公司，专注于创新平台的研发和新兴企业的孵化，致力于在人类健康与可持续发展领域取得革命性进展。 Flagship Pioneering 已与 Activeloop 建立深度合作，旨在增强其在科学研究领域的 RAG (检索增强生成) 能力。在此次合作中，Flagship Pioneering 旗下的 Pioneering Intelligence 团队与 Activeloop 紧密协作，共同研发了一套基于 Activeloop Deep Lake 知识代理的先进系统。借助该系统，Flagship Pioneering 能够高效检索全球范围内的科学研究成果，并通过多模态生物医学数据进行深入挖掘，其检索准确率相较于传统的基于向量或关键词的搜索技术提升了约 18%。尤其值得一提的是，该系统甚至能够从文章文本中未明确提及的特定图表中精准捕获关键信息，从而显著增强了 Flagship Pioneering 的科研实力。