通过受控实验探索 AI Agent 如何利用业务上下文做出正确决策。
通过受控实验量化业务上下文对 Text-to-SQL 准确率的影响。建立评测基准,形成可复现的方法论。
从 Text-to-SQL 扩展到更多 Agent 场景。构建可插拔的上下文注入框架,支持动态规则匹配与自适应上下文选择。
探索 AI Agent 的通用上下文层标准。让 Agent 像人类新员工 onboarding 一样自然地理解任意领域的隐含知识。
5 个 Context Level × 26 条查询的受控实验。注入精准业务规则使准确率从 30.8% 飙升至 65.4%(+34.6pp),Schema Graph 结构下达到最优 76.9%(+46.1pp)。实验证实:上下文编排的结构是决定 Agent 表现的第一性因素。