Reflection / 思考

The Engineering Path of AI Agents: From Context to Systems

AI Agent 的工程化路径：从上下文到系统 —— ----季逸超（peak Ji）访谈学习总结

2026 年一月 published

AIAgentSystemsEngineeringLLM

摘要（Abstract）

本文从工程与系统视角，对 Manus 首席科学家季逸超关于 AI Agent 的访谈进行高抽象层级的再整理。核心结论是：AI 时代的关键竞争力不在于“模型是否更强”，而在于“系统是否能在真实环境中稳定行动并持续自我修正”。Agent 的价值来自长任务（Long Horizon）、环境耦合、反馈闭环与低等待成本的组织与工程结构，而非简单的自动化或界面接管。

1. 产品第一性：占据上下文，而不是堆叠功能

从 Monica到 Manus 的演进，体现了一条清晰的产品原则：

AI 产品的核心不是功能集合，而是上下文嵌入能力（Context Embedding）。插件、浏览器能力或系统级注入的本质，在于：

不改变用户原有行为路径；
在正确的上下文节点，以极低的打断成本提供确定性增益；
让能力“顺手出现”，而非强迫用户迁移到新界面。

工程含义在于：上下文即分发。一旦脱离真实上下文，功能数量越多，复杂度与认知负担越高，产品价值反而递减。

2. 创业与技术路线：PMF 优先于自研模型

访谈明确反对在早期阶段“自下而上押注模型能力”的路径，其原因并非否认模型重要性，而是工程与节奏问题：

模型训练周期天然慢于产品迭代；
在 PMF 未验证前自研模型，本质是高不确定性的技术赌博；
更稳健的路径是：先用现有模型完成产品探索，再用自研模型优化成本或突破上限。

这是一种反“沿途下站”的策略：先确保方向正确，再决定是否重资产投入。

3. 决策结构：用组织设计降低等待成本

公司管理使用 GPA 决策模型，本质是工程化思维在组织层的投射：

G（Goal）目标：集权式决策，避免目标漂移；
P（Priority）优先级：专家充分输入 + 单点拍板；
A（Alternative）方案空间：高度民主，追求方案数量。

其核心目标并非“更公平”，而是最小化悬而未决的等待成本。在不确定环境中，延迟往往比错误更昂贵。

4. Agent 的边界：价值只存在于 Long Horizon 任务

访谈对“AI 接管桌面 / 浏览器”的形态持明确保留态度，原因是系统层面的不适配：

操作系统是为人类单一主体设计的，存在 Observation 冲突；
对短、低成本任务，人类的直觉与肌肉记忆效率远高于云端 Agent；
强行自动化简单任务，会导致体验反直觉。

因此，Agent 的合理任务域应满足：

跨度长（多步骤、多状态）；
中间态价值低；
人类不愿持续投入注意力；
最终结果价值显著。

5. 工程方法论：反补丁，强调可观察与自纠错

在 Agent 系统设计中，访谈反复强调一个原则：

不要用规则去覆盖失败案例，而要让系统具备发现和修正错误的能力。

工程上，这意味着：

过多 hard rule 会压缩模型多样性；
更优解是扩大 action space，并提供结果可观察性；
让模型通过“看到结果”来修正，而非提前被限制。

这是从“写程序”向“训系统”的转变。

6. 模型侧洞察：Agent 需要环境交错推理

访谈指出 Chatbot 模型在 Agent 场景的系统性缺陷：

偏好一次性完成回答，而非循环推进；
长上下文导致 context pressure，质量随链路变长下降；
缺乏对记忆外化（offload）的原生意识。

Agent 所需的并非更长的思维链，而是：

Observation → Short Thinking → Action 的交错循环；
Compression awareness（知道何时压缩与外置记忆）；
面向环境反馈的鲁棒性。

7. 护城河：沉淀在应用层的反馈飞轮

在 Agent 产品中，真正可持续积累的并非模型参数，而是：

用户在真实环境中的失败轨迹；
人类对结果的修正与教学行为；
系统将这些反馈内化为能力的过程。

这种 collective feedback 形成应用层飞轮，使系统在参数不变的情况下持续进化。

8. 商业视角：AI 更像制造业而非软件

访谈将 AI 商业化类比为制造业：

推理成本随使用线性增长；
运营与成本控制能力决定毛利；
定价结构需尽量简单，降低用户决策负担。

工程与运营能力，在此成为核心竞争力。

结论

Manus 的实践路径揭示了一条清晰的工程化路线：

Agent 的核心不是“更聪明”，而是“更稳定地在环境中行动，并能持续自我修正”。

这要求产品、组织、工程与模型设计在同一系统逻辑下协同演进。

关键词（Keywords）

AI Agent；Long Horizon；Context Embedding；Action Space；ReAct Loop；Collective Feedback；PMF；工程化 AI