← 参考列表
Product with Attitude · Karo Zieminski
Context Engineering for Product Builders: The 2026 Operating Manual
背景
这篇文章来自 Karo Zieminski 的 Newsletter "Product with Attitude"(18K 订阅者),定位为 AI PM 视角的上下文工程实践指南。2026 年 5 月发布,是目前关于上下文工程最系统的实操文献。
文章从第一性原理出发——上下文工程不是 prompt 工程的升级版,而是一个独立的系统设计学科。它的核心议题是:当 Agent 执行任务时,它的"知识环境"应该怎么设计?这个问题和上下文 Lab 的研究目标完全一致。
Context engineering is a systems design discipline that separates working AI from failing AI. It replaces prompt engineering as a core skill for product and workflow builders in 2026.
—— 开篇定调
上下文工程 vs Prompt 工程
文章最核心的区分:
Prompt engineering is deciding what and how to ask the model. Context engineering is deciding what the model knows when it answers.
—— 一个开启对话,一个塑造对话发生的信息生态
作者给出了一个不对称性公式:精心写的 prompt + 糟糕的上下文 = 仍然失败。糟糕的 prompt + 精心设计的上下文 = 经常成功。这个不对称性就是为什么上下文工程是更值得投入的方向。
文章追溯了这个词的确切起源:2025 年 6 月,Shopify CEO 发推说"我更喜欢 'context engineering' 而不是 'prompt engineering'"。推文里给出了后来成为经典的思维模型:"上下文窗口是 RAM。我们是操作系统。"
这个模型后来被 LangChain 团队系统化为四个策略。
LangChain 四策略框架:Write / Select / Compress / Isolate
- Write(写入) — 把上下文保存在窗口外部(CLAUDE.md、AGENTS.md、数据库),不塞进有限的上下文窗口。这是 Agent 的永久参考文档,不会被压缩、裁剪或扭曲。
- Select(选择) — 只检索当前需要的部分。RAG 是这个理念的体现,但好的系统不止于找到可能的匹配——还会重排序,确保只有最相关的信息进入上下文。
- Compress(压缩) — 任务变长时主动压缩。Claude Code 的 "auto-compact" 是一个例子。目标是保留完成任务仍需要的部分,而不是记住一切。金句:"看一个 $200 的 Agent 慢慢变成 $2000 但更差的 Agent"。
- Isolate(隔离) — 按角色隔离上下文。客服 Agent 需要客户历史,不需要竞品文档。每个 Agent 只看自己需要的。
文章提供了一个实践工具——上下文工程审计 Prompt,让 PM 在构建前用它对 Agent 的信息设计做压力测试。
上下文腐败:10 种失效模式
文章列举了真实系统中上下文失效的 10 种方式,每一种都在上下文 Lab 的实验场景中有对应:
- Overload(过载) — 塞了整库文档,重要细节被淹没
- Contamination(污染) — 错误信息写入了记忆并持续存在
- Distraction(分心) — 不相关但显眼的信息抢夺注意力
- Ambiguity(模糊) — 信息重叠或模糊扰乱推理
- Contradiction(矛盾) — 两个来源冲突
- Staleness(过期) — 预加载的上下文已过时
- Tool Bloat(工具膨胀) — 注册太多工具,每个都消耗注意力
- Pattern Lock(模式锁定) — Agent 陷入重复模式,错过异常
- Lost in the Middle(中间丢失) — 关键信息在长上下文中间被忽略(引用 Liu et al. 2023)
- Memory Soup(记忆混合) — 偏好、失败记录、永久规则混在一起无法区分管理
文章还给出了 6 个实操信号来判断上下文是否已经开始变质:Agent 重复问同一个问题、忘记之前的决策、虚构工具或文件、突然问你在做什么、交接记录丢失关键信息。
Stanford ACE:自改进的上下文层
这是整篇文章在学术层面上最重要的引用。2025 年 10 月,Stanford、SambaNova Systems 和 UC Berkeley 联合提出了 ACE(Agentic Context Engineering)框架。
Instead of treating context as a fixed prompt, ACE treats it as an evolving instruction set that improves with experience.
—— ACE 的核心思想
ACE 架构有三个组件:
- Generator — 执行任务
- Reflector — 回顾任务表现
- Curator — 更新下一次执行的指令、策略、示例和经验
关键意义:不改变模型权重,只改进模型周围的信息环境。ACE 在 Agent 基准上提升 10.6%,金融任务提升 8.6%,同时降低了延迟和成本。
这和上下文 Lab 的方向高度一致——如果把 ACE 的 Curator 替换为 Schema Graph 的治理层,就构成了"自维护的上下文注入系统"架构。
PM 应该拥有上下文架构决策权
Context engineering is not purely an engineering discipline. It sits at the intersection of product strategy, user understanding, and system design.
—— PM 的核心领地
文章认为 PM 应该定义每层上下文放什么、什么时候该过期、什么应该重新获取。工程师负责构建检索和存储的基础设施。如果 PM 不做这个决策,要么工程替你做,要么没人做——然后 Agent 把能拿到的所有信号全塞进窗口。
文章给出了一个上下文金字塔(Context Pyramid):Identity → Knowledge → State → Task,用来在 Agent 出问题时快速定位哪层上下文坏了。
与上下文 Lab 的关系
这篇文章是上下文 Lab 研究方向的最佳实践对照物:
- 四策略 = 实验设计的理论基础 — Write/Select/Compress/Isolate 可以直接对应上下文 Lab 5-Level 实验中的不同上下文注入策略。例如 Level 3(精准规则注入)= Select,Level 4(Schema Graph)= 结构化的 Isolate。
- ACE = Context Layer 自动化方向 — Stanford ACE 的 Generator→Reflector→Curator 循环,可以作为 Context Layer 从"手工设计"走向"自动维护"的技术路径参考。
- 上下文腐败 = 实验中的准确率衰减 — 文章列出的 10 种失效模式,和上下文 Lab 实验中观察到的"随着上下文复杂度增加,某些层级的准确率反而下降"现象有直接对应。
- PM 角色 = 上下文 Lab 的用户定位 — 文章认为 PM/产品构建者应该是上下文架构的决策者,这和上下文 Lab 的受众(需要设计 Agent 上下文的开发者/产品经理)重合。
阅读原文 →