参考列表
Glean

Context Graphs: Powering Enterprise AI Agents

背景

Glean 是企业 AI 搜索公司,这篇来自他们的工程博客。文章出发点是两个问题:Context Graph 到底是什么,以及怎么构建。

Context graphs are getting a lot of attention right now, with investors calling them a "trillion-dollar opportunity."
—— Context Graph 正在成为投资热点

因为 AI 模型能调用工具了,但缺乏理解实际工作流程的知识。系统记录了决策结果,但真正的工作发生在会议、聊天、邮件和文档里。没有结构化的工作流程视图,AI 无法可靠地自动化。


Context Graph 的定义

文章给出精确定义:

A context graph is a model that connects your enterprise entities (people, documents, tickets, systems) with the temporal traces of actions and events between them. It then surfaces actionable insights from those traces so AI understands how work actually gets done.

核心转变:从描述"有什么"到描述"变化怎么发生"。

图的构成:节点 = 动作("创建"、"查看"、"审批"、"升级"、"解决",每个带时间戳和元数据),边 = 因果关系("消息 A 触发更新 B,概率 P")。

Context Graph 能回答的问题示例:"P1 事件通常怎么解决的?"、"产品 X 最常见的问题升级路径是什么?"、"从'试点创建'到'交易关闭'通常经历什么?"


三层架构

混合存储模型

文章讨论了存储决策:纯图结构太僵化,原始文本太难以导航。Glean 的选择是混合模型:把自由文本分段,嵌入实体 ID。例如一个事件处理流程被切成短段,标记阶段转换——"调查中"→"缓解中"——通过标记实体 ID(如 incident_id=INC-123)让 Agent 能一步步走流程。代价是不适合同时跨数千个事件推理。


反馈闭环:Agent 执行强化 Context Graph

文章指出:如果 Agent 在系统外运行,Context Graph 永远不会从它们身上学习。如果 Agent 在系统内运行,每次执行都会成为一条新轨迹:调用了哪些工具、什么顺序、成功还是失败、用户是否点赞。离线时系统回放并尝试替代路径,评分标准包括正确性、完整度、指令遵循度和效率。

成功执行强化了期望的模式,失败执行标记了反模式。随着时间推移,Context Graph 成为人类和 Agent 行为的联合模型——它不只描述工作过去是怎么做的,还反映当前人类和 Agent 共同协作下工作正在怎么展开。

The context graph must be owned jointly by the data layer and the orchestration layer. Separating them creates drift: the graph evolves one way, agent execution evolves another, and you end up with two divergent versions of reality.
—— 数据层和编排层必须统一拥有 Context Graph

Glean 的内部验证方法

Glean 在实际构建之前先做了内部测试:让员工 opt-in 共享 Personal Graph 数据 → 识别高频高价值流程(如"AE 中端市场交易周期"、"on-call 事件响应"、"PM 功能发布") → 用时间维度区分低价值和高价值流程 → 找领域专家验证 A 路径 vs D 路径的区别和偏差原因 → 把这些流程做成可工作的 Agent。

最终目标不是静态的 Agent,而是让 Agent 持续从 Context Graph 中获取新鲜流程洞察,把越来越多的逻辑推入学习层而不是依赖手动维护的指令。


与上下文 Lab 的关系

阅读原文 →