AI个人学习
和实操指南

Context:无缝集成各类数据源源,多角色Agent自动化完成不同工作场景内容

综合介绍

Context Autopilot 是一款由 Context 公司推出的智能AI生产力工具,旨在通过深度集成和自动化办公来提升团队的工作效率。该工具利用全球首个上下文引擎 Context-1,能够从用户的数据中获取深度引用和新颖见解,提供准确的答案。Context Autopilot 支持100多种集成,能够无缝连接用户的各种数据源,帮助用户快速生成和编辑专业文档、演示文稿和数据可视化。

Context 像人类一样根据不同工作任务思考,适合自动化生成商业咨询、财务分析、数据可视化、企业报告撰写、项目演示文稿、数据分析等专业工作场景。


Context:接入办公文档并生成各类工作场景内容-1

 

Context:无缝集成各类数据源源,多角色Agent自动化生成不同工作场景内容-1

 

功能列表

  • 深度引用和新颖见解:利用 Context-1 引擎,从用户数据中提取深度引用和新颖见解。
  • 数据集成:支持100多种数据集成,能够无缝连接用户的各种数据源。
  • 文档生成和编辑:快速生成和编辑专业文档,包括合同、报告等。
  • 演示文稿生成和编辑:快速生成和编辑专业演示文稿,从客户演示到内部评审。
  • 数据可视化:使用 Python 创建数据可视化,分析大型数据集。
  • 自然语言命令:通过自然语言命令构建和修改复杂的财务模型,分析数据趋势。

 

使用帮助

安装流程

  1. 注册账户:点击页面右上角的“注册”按钮,填写相关信息完成注册。
  2. 下载软件:注册完成后,登录账户并下载 Context Autopilot 安装包。
  3. 安装软件:运行下载的安装包,按照提示完成安装。

使用流程

  1. 登录账户:打开 Context Autopilot 软件,输入注册时的账户信息进行登录。
  2. 数据集成:在主界面选择“数据集成”选项,按照提示连接需要集成的数据源。
  3. 生成文档:选择“文档生成”功能,输入相关信息,软件会自动生成专业文档。
  4. 编辑文档:在生成的文档基础上,可以使用内置的编辑工具进行修改和完善。
  5. 创建演示文稿:选择“演示文稿生成”功能,输入相关信息,软件会自动生成专业演示文稿。
  6. 数据可视化:选择“数据可视化”功能,使用 Python 代码创建数据可视化,分析数据趋势。
  7. 使用自然语言命令:在“自然语言命令”界面,输入自然语言指令,软件会自动执行相应的操作,如构建财务模型、分析数据趋势等。

功能操作流程

  1. 深度引用和新颖见解:在主界面选择“深度引用”功能,输入需要分析的数据,软件会自动提取深度引用和新颖见解。
  2. 数据集成:在“数据集成”界面,选择需要集成的数据源,按照提示完成连接。
  3. 文档生成和编辑:在“文档生成”界面,输入相关信息,软件会自动生成文档。生成后,可以使用内置的编辑工具进行修改和完善。
  4. 演示文稿生成和编辑:在“演示文稿生成”界面,输入相关信息,软件会自动生成演示文稿。生成后,可以使用内置的编辑工具进行修改和完善。
  5. 数据可视化:在“数据可视化”界面,输入 Python 代码,软件会自动生成数据可视化图表。
  6. 自然语言命令:在“自然语言命令”界面,输入自然语言指令,软件会自动执行相应的操作,如构建财务模型、分析数据趋势等。

 

引入 Context Autopilot

Context,我们很高兴推出Autopilot — 一款像您一样学习、像您一样思考、像您一样使用工具的 AI 生产力套件。Autopilot 由世界上第一个上下文引擎提供支持,旨在与您现有的工作流程无缝集成,能够处理当今大多数信息工作。

重新思考人工智能的工具

随着大型语言模型 (LLM) 变得越来越智能,我们使用的工具也需要随之发展。传统软件是为人工输入而构建的 — — 这一传统可以追溯到 20 世纪 70 年代。这种模式正在发生变化,未来的核心是生成性。当前的解决方案通常是增量式的、不可解释的,或者需要改变工作流程,从而限制了它们的采用和实用性。

基于 LLM 的操作系统

Autopilot 通过提供基于 LLM 的操作系统来解决这些挑战,在该系统中,模型成为主要的协调器和推理器,与我们的上下文引擎协同工作。它通过提供专用工具和稀缺的情境上下文来解除模型的束缚,使它们能够解析组织并更像人类一样思考。

Autopilot 拥有自己的工作空间,直接连接到 Drive 和 Sharepoint 等服务、Slack 和 Email 等通信渠道以及客户文档、个人笔记和外部数据库。

与现有工作流程无缝集成

Autopilot 使用与您相同的工具构建项目。它可以使用完整的办公套件、浏览器和代码编辑器。Autopilot 应用程序专为其自身而设计,支持直接状态操作和复杂的多步骤工作流程。

这为人工智能提供了人类所需的必要知识,以实现有意义的理解和互动。自动驾驶仪能够积极地与用户合作,询问偏好和信息,获取反馈,并并行执行任务,同时让您专注于最重要的事情。

通过实时报告进度,它实现了持续的人机协作。面对复杂的挑战时,Autopilot 可以自我复制,组建成群的协作代理,专注于一个共同的目标。这可以高效地委派和执行任务,就像一个协调良好的团队一样。

内存堆栈:为上下文引擎提供动力

所有这些都是由 Autopilot 的内存堆栈实现的,它超越了共享工作区,以确保文件系统和输入之间的一致性。它支持持续的反射和输出迭代——这就是上下文引擎。

上下文引擎:一种新范式

上下文引擎允许模型对大量知识进行推理,并真正理解。这也是 Autopilot 能够规划、推理和执行需要数百步的任务的原因。

检索增强生成 (RAG) 从根本上受到搜索架构的限制,只能扩展到少数语义相似的数据。相比之下,Autopilot 的上下文引擎可让大量代理不断遍历您的知识库,追踪新路径,发现联系并发掘见解。通过提炼数千次交互,我们可以在庞大的上下文中提供尖端情报,而不会出现与长上下文模型相关的性能下降。

上下文是动态的,它可以随着时间的推移不断学习并纠正错误。Autopilot 不断监控传入的信息,并通过查询外部数据源自主完善自身。这可以实现深入的任务理解和技能获取——Autopilot 可以像任何员工一样接受您选择的指令集的培训。

技术评估:对上下文引擎进行基准测试

为了评估我们的上下文引擎的有效性,我们使用两个综合基准将其与其他前沿模型和 RAG 实现进行了对比:

  • HELMET如何有效彻底地评估长上下文语言模型(Yen 等人,2024)
  • LOFT长上下文前沿基准测试,引入于《长上下文语言模型能否包含检索、RAG、SQL 等?》(Lee 等人,2024 年)

传统基准的局限性

流行的“大海捞针”测试评估模型在长上下文窗口内定位特定信息的能力。然而,几乎所有模型都已经饱和,并且与实际性能几乎没有关联。HELMET 显著改进了现有的长上下文基准,并解决了其他流行基准(如 RULER)的缺点。

HELMET 基准测试结果

Context:无缝集成各类数据源源,多角色Agent自动化生成不同工作场景内容-1 图 1展示了前沿 LCLM(Llama-3.1 8B/70B、GPT-4omini、GPT-4o-08-06 和 Gemini-1.5 Flash/Pro)在 128k 个 token 输入长度下的长上下文基准测试结果。出现了意想不到的趋势:在 RULER 上,Llama 8B 的表现优于 Llama 70B,而 Gemini 1.5 Flash 的表现优于 Gemini 1.5 Pro。同样,在 InfiniteBench 上,Llama 8B 的表现优于 Llama 70B,而在“大海捞针”上,Gemini 1.5 Flash 的表现优于 Gemini 1.5 Pro。另一方面,HELMET 对这些前沿模型的排名更为一致。

Context:无缝集成各类数据源源,多角色Agent自动化生成不同工作场景内容-1 图 2比较了 ZeroSCROLLS、LongBench、L-Eval、RULER、∞BENCH 和 HELMET 等长上下文基准。HELMET 具有七个不同的任务类别,它们之间的相关性较低。它支持对大于 128k 个标记的上下文窗口大小进行评估;但是,官方存储库目前支持对高达 128k 个标记上下文大小的评估。这就是为什么我们使用 LOFT 来评估更长上下文大小(特别是 100 万个标记)的性能。

评估方法

我们使用以下参数进行了评估:

  • 头盔:在整个基准测试的随机 15% 子集上运行。
    • 任务类型和指标
      • RAG:子字符串精确匹配
      • 段落重新排序:NDCG@10(标准化折扣累积增益)
      • 带引文的生成:回忆/引用
      • 长文档 QA:基于模型/ROUGE F1/准确率
      • 摘要:基于模型
      • 多样本情境学习:准确性
      • 综合召回:子字符串精确匹配
  • LOFT:在三个任务的随机 30% 子集上运行。
    • 任务类型和指标
      • RAG:子跨度精确匹配
      • 文本检索:Recall@1
      • SQL:准确性

由于官方存储库中没有可用于测试 100 万个 token 上下文大小的数据集,因此我们省略了多镜头上下文学习任务。我们还跳过了音频检索和视觉检索任务。这些评估中使用的所有模型都是撰写本文时可用的最新版本。

基准测试结果

我们的评估表明,Autopilot 的上下文引擎在 HELMET 等基准测试中处于领先地位,并且比使用前沿模型的 GraphRAG 表现更好。通过对整个知识体系进行推理并真正理解,Autopilot 超越了传统 RAG 架构的限制。

未经允许不得转载:首席AI分享圈 » Context:无缝集成各类数据源源,多角色Agent自动化完成不同工作场景内容

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文