← 参考列表
Your Data Agents Need Context
背景
这篇文章发表在 2026 年 3 月,被 a16z 归类为 Infra 赛道的研究。两位作者 Jason Cui 和 Jennifer Li 分别是 a16z 在基础设施和 AI 领域的投资人。
文章用一个三阶段叙事梳理了市场演进的脉络:
- 🏗️ Modern Data Stack 崛起 — 过去十年数据架构经历了 ingestion → transformation → warehousing → storage 的统一化进程(dbt、Fivetran、Snowflake、Databricks)。数据被集中、清理、变得可查询。团队通过 SQL + BI 工具(Looker、Tableau)进行业务分析。
- 🤖 Agent 狂热(2024→2025) — LLM 能力爆发后,几乎每家企业都想在数据栈之上构建 Agent。Bottoms-up(开发者想用最新功能)和 tops-down(管理层想降本增效)同时驱动,诞生了大量"chat with your data"聊天机器人和分析助手。
- 💥 撞墙 — 绝大多数 Agent 部署失败了。MIT 2025 报告指出 AI 部署失败的主因是"脆弱的流程、缺乏上下文学习、与日常运营脱节"。Agent 连最基本的业务问题都答不对。
本文的核心贡献在于:它不是把 Agent 失败归咎于模型能力不足(SQL codegen、推理能力),而是指出问题根源在于缺乏上下文层。
文章还提到了这个领域的多种叫法——context OS、context engine、contextual data layer、ontology——说明这个品类仍在早期,但底层概念是一致的。
核心问题:一个"简单"问题的三座大山
文章中段用一个精心设计的例子,逐层展示了数据 Agent 在面对一个看似简单的问题时暴露的深层缺陷。
"What was revenue growth last quarter?"
—— 一个人类瞟一眼仪表盘就能回答的问题
这个 Query 触发三层失败链:
- 🧱 第一层:业务定义不明 — Revenue 是 run rate 还是 ARR?Fiscal quarter 怎么算的?不同部门有不同的口径。语义层(LookML)理论上可以解决,但它的 YAML 文件可能是已离职同事维护的、BI 工具早已不再使用、也没有包含之后新增的两条产品线。Agent 完全不知道当前的 revenue 定义是什么。
- 🗃️ 第二层:数据源选择 — 描述完定义后,团队发现数据分散在多个表和数仓中。Finance 团队用 fct_revenue 表,Data 团队创建了 mv_revenue_monthly、mv_customer_mrr 等物化视图。Agent 不知道该用哪个表作为真实来源。
- 🧑🤝🧑 第三层:部落知识 — 很多关键的业务规则没有写在任何文档里,只存在于团队成员的头脑中——哪些产品线的收入应该计入、哪些应该排除、是否有特殊的折扣逻辑。这些隐含知识一旦人员流动就彻底丢失。
文章的核心判断是:这三层问题都无法靠更好的模型解决。即使 GPT-5 的 SQL 能力再强一倍,它还是不知道 revenue 的定义、不知道该查哪个表、不知道产品线之间的排除规则。这不是代码生成问题,是业务语义问题。
值得注意的是,这个问题恰好对应上下文 Lab 受控实验中的不同 Context Level——从裸 Schema(无上下文,准确率 30.8%)到注入规则(准确定义和数据源指引,65.4%),再到 Schema Graph(结构化的上下文关系,76.9%)。文章用叙事论证的,实验用数据验证了。
关键引述与解读
data and analytics agents are essentially useless without the right context
—— 全文基石:上下文不是锦上添花,是必要条件
这句话是整篇最核心的判断:没有上下文的 Agent 不仅是不准确,而是 "useless"。这个定性把 Context Layer 从"可选的优化手段"提升到了"必要的基础设施"的层面。
we've quickly learned that the problem extends beyond just text to SQL
—— 认知转变:模型能力不是瓶颈
早期大家认为 Agent 做不好数据分析是因为模型 SQL 能力不够(Spider 2.0 / Bird Bench 基准也确实显示模型落后)。但实际问题是:即使用最好的模型,Agent 也无法理解"revenue"在不同部门的定义差异、无法知道哪个表才是正确的数据源。这是业务语义问题,不是代码生成问题。
Tie together all of an enterprise's messy data, add a contextual layer on top that helps agents understand business logic, and package it such that the context can be supplied to agents.
—— Context Layer 的精确定义
这段话定义了 Context Layer 的三层职责:连接(整合散乱数据)- 翻译(注入业务逻辑)- 供给(标准化接口输出)。后文指出这可以通过 API 或 MCP 暴露。
A modern data context layer should essentially become a superset of what a semantic layer would traditionally cover.
—— Context Layer ≠ Semantic Layer
文章明确指出传统语义层(LookML、dbt 指标定义)的局限性:它们通常绑定在特定 BI 工具上、需要手写 YAML、会过时。而 Context Layer 的覆盖范围更广:包括规范实体(canonical entities)、身份解析(identity resolution)、部落知识拆解、治理规则。
the key to effective data agents is actually building the relevant context layer
—— 市场共识的形成
这句话标志着投资机构的判断:经过一年多的市场验证,做 Agent 的公司发现瓶颈不在模型、不在数据接入,而在上下文构建。正在催生新的公司品类。
a new category of company has emerged that is building context layers from the ground up
—— 新品类诞生
It's a blend of technical challenges related to data infrastructure and engineering with human operational challenges related to tribal knowledge collection.
—— 技术 + 组织的双重挑战
the context layer becomes a living and constantly evolving corpus
—— Context Layer 不是静态产物,需要持续维护
架构蓝图:5 步构建 Context Layer
文章基于与客户的交流,提出了现代 Context Layer + Agentic Data System 的完整架构:
- 1. 数据接入(Table Stakes) — 确保 Agent 能访问所有需要的数据。理想情况下通过 Lakehouse 架构实现一定程度的统一。但 Agent 需要的数据不局限于数仓和业务应用,还应包括存储在 GDrive/Slack 等内部系统中的部落知识。这一步是前提条件。
- 2. 自动上下文构建 — 利用 LLM 自动完成初始上下文的收集。重点提取高信号上下文,例如:通过历史查询日志分析最常被引用的表和最常见的 JOIN 模式;从 dbt 和 LookML 等数据建模方案中提取业务指标的明确定义。
- 3. 人工校准 — 自动构建可以覆盖大部分上下文,但无法形成完整图景。最重要的上下文往往是隐含的、条件的、历史权变的——只存在于团队内部的部落知识中。这一步需要领域专家介入,校准和补充自动化遗漏的部分。
- 4. 通过 API / MCP 暴露 — Context Layer 构建完成后,需要通过标准接口供给 Agent。文章指出这通常通过 API 或 MCP(Model Context Protocol)实现。
- 5. 持续维护 — 数据系统不是静态的,Context Layer 也不应该静态。数据源和格式会变化、业务需求会调整、Agent 给出错误结果时需要修正反馈。Context Layer 应该是一个"living and constantly evolving corpus"。
这个架构设计的精妙之处在于:它把 Context Layer 的构建从"一次性工程"变成了持续运营——自动构建降低初始成本,人工校准保证质量,API 暴露实现复用,持续维护防止退化。
市场格局:三类玩家的竞争态势
文章分析了当前市场的三类参与者:
- 数据引力平台(Databricks / Snowflake) — 它们已经完成了数据接入、转换和存储的基础设施建设,数据引力强大。Databricks Genie 和 Snowflake Cortex Analyst 等产品已提供轻量级语义建模能力。虽然目前没有成熟的 Context Layer 功能,但可以通过收购或自建将 Context Layer 纳入平台。
- 演化型公司 — 一批原本做"chat with your data"的公司,在市场上发现数据 Agent 成败的关键在于上下文构建,因此逐渐将产品方向演化为 Context Layer 的构建和维护。
- 原生 Context Layer 公司 — 从零开始构建 Context Layer 的新公司品类。它们需要完整经历上述的数据接入、部落知识收集等全部流程,并且要为每个客户重复这一过程。
文章认为这是一个正在形成的全新品类,而非已有功能的简单升级。市场仍在早期,很多开放问题尚未定论。
与上下文 Lab 的关系
这篇文章不是学术论文,而是风投发出的市场信号。它在说:整个行业都意识到 Context Layer 是 AI Agent 基础设施的关键拼图,这个方向正在成为主流。
上下文 Lab 的数据受控实验(5 个 Context Level × 26 条查询)恰好从量化验证的角度回答了文章提出的核心命题:
- 问题成立吗? — 是的。Schema-only 准确率仅 30.8%,注入规则后飙升至 65.4%(+34.6pp)。
- 什么结构最有效? — Schema Graph 达到 76.9%(+46.1pp),验证了文章"context layer 是 semantic layer 的超集"的判断——結構化的上下文远比扁平文本有效。
- 仅仅是模型问题吗? — 不。同一模型在 5 个 Context Level 下的准确率差异达 46.1pp,证明上下文编排才是决定性因素。
某种意义上,这篇文章是上下文 Lab 的「为什么」,而数据实验是「怎么证明」。
后续值得关注的方向
文章在结尾提出了几个开放问题,也是上下文 Lab 可以持续探索的:
- Context Layer 的载体问题:它是独立产品、是数据平台的内置功能、还是协议(MCP)层面的标准?
- 动态维护:文章指出 context layer 应该是"living and constantly evolving corpus"。数据变更、人员流动时如何自动维护上下文?
- 量化评测:文章用叙事论证,上下文 Lab 的实验已经开始了量化评测。我们能否建立 Context Layer 的标准化评测基准?
阅读原文 →