研究

通过受控实验探索 AI Agent 如何利用业务上下文做出正确决策。

研究路线

近期 · 0–6 个月

通过受控实验量化业务上下文对 Text-to-SQL 准确率的影响。建立评测基准，形成可复现的方法论。

进行中

中期 · 6–18 个月

从 Text-to-SQL 扩展到更多 Agent 场景。构建可插拔的上下文注入框架，支持动态规则匹配与自适应上下文选择。

规划中

远期 · 18 个月+

探索 AI Agent 的通用上下文层标准。让 Agent 像人类新员工 onboarding 一样自然地理解任意领域的隐含知识。

愿景

5 个 Context Level × 26 条查询的受控实验。注入精准业务规则使准确率从 30.8% 飙升至 65.4%（+34.6pp），Schema Graph 结构下达到最优 76.9%（+46.1pp）。实验证实：上下文编排的结构是决定 Agent 表现的第一性因素。