The Engineering Path of AI Agents: From Context to Systems
AI Agent 的工程化路径:从上下文到系统 —— ----季逸超(peak Ji)访谈学习总结
摘要(Abstract)
本文从工程与系统视角,对 Manus 首席科学家季逸超关于 AI Agent 的访谈进行高抽象层级的再整理。核心结论是:AI 时代的关键竞争力不在于“模型是否更强”,而在于“系统是否能在真实环境中稳定行动并持续自我修正”。Agent 的价值来自长任务(Long Horizon)、环境耦合、反馈闭环与低等待成本的组织与工程结构,而非简单的自动化或界面接管。
1. 产品第一性:占据上下文,而不是堆叠功能
从 Monica到 Manus 的演进,体现了一条清晰的产品原则:
AI 产品的核心不是功能集合,而是上下文嵌入能力(Context Embedding)。插件、浏览器能力或系统级注入的本质,在于:
- 不改变用户原有行为路径;
- 在正确的上下文节点,以极低的打断成本提供确定性增益;
- 让能力“顺手出现”,而非强迫用户迁移到新界面。
工程含义在于:上下文即分发。一旦脱离真实上下文,功能数量越多,复杂度与认知负担越高,产品价值反而递减。
2. 创业与技术路线:PMF 优先于自研模型
访谈明确反对在早期阶段“自下而上押注模型能力”的路径,其原因并非否认模型重要性,而是工程与节奏问题:
- 模型训练周期天然慢于产品迭代;
- 在 PMF 未验证前自研模型,本质是高不确定性的技术赌博;
- 更稳健的路径是:先用现有模型完成产品探索,再用自研模型优化成本或突破上限。
这是一种反“沿途下站”的策略:先确保方向正确,再决定是否重资产投入。
3. 决策结构:用组织设计降低等待成本
公司管理使用 GPA 决策模型,本质是工程化思维在组织层的投射:
- G(Goal)目标:集权式决策,避免目标漂移;
- P(Priority)优先级:专家充分输入 + 单点拍板;
- A(Alternative)方案空间:高度民主,追求方案数量。
其核心目标并非“更公平”,而是最小化悬而未决的等待成本。在不确定环境中,延迟往往比错误更昂贵。
4. Agent 的边界:价值只存在于 Long Horizon 任务
访谈对“AI 接管桌面 / 浏览器”的形态持明确保留态度,原因是系统层面的不适配:
- 操作系统是为人类单一主体设计的,存在 Observation 冲突;
- 对短、低成本任务,人类的直觉与肌肉记忆效率远高于云端 Agent;
- 强行自动化简单任务,会导致体验反直觉。
因此,Agent 的合理任务域应满足:
- 跨度长(多步骤、多状态);
- 中间态价值低;
- 人类不愿持续投入注意力;
- 最终结果价值显著。
5. 工程方法论:反补丁,强调可观察与自纠错
在 Agent 系统设计中,访谈反复强调一个原则:
不要用规则去覆盖失败案例,而要让系统具备发现和修正错误的能力。
工程上,这意味着:
- 过多 hard rule 会压缩模型多样性;
- 更优解是扩大 action space,并提供结果可观察性;
- 让模型通过“看到结果”来修正,而非提前被限制。
这是从“写程序”向“训系统”的转变。
6. 模型侧洞察:Agent 需要环境交错推理
访谈指出 Chatbot 模型在 Agent 场景的系统性缺陷:
- 偏好一次性完成回答,而非循环推进;
- 长上下文导致 context pressure,质量随链路变长下降;
- 缺乏对记忆外化(offload)的原生意识。
Agent 所需的并非更长的思维链,而是:
- Observation → Short Thinking → Action 的交错循环;
- Compression awareness(知道何时压缩与外置记忆);
- 面向环境反馈的鲁棒性。
7. 护城河:沉淀在应用层的反馈飞轮
在 Agent 产品中,真正可持续积累的并非模型参数,而是:
- 用户在真实环境中的失败轨迹;
- 人类对结果的修正与教学行为;
- 系统将这些反馈内化为能力的过程。
这种 collective feedback 形成应用层飞轮,使系统在参数不变的情况下持续进化。
8. 商业视角:AI 更像制造业而非软件
访谈将 AI 商业化类比为制造业:
- 推理成本随使用线性增长;
- 运营与成本控制能力决定毛利;
- 定价结构需尽量简单,降低用户决策负担。
工程与运营能力,在此成为核心竞争力。
结论
Manus 的实践路径揭示了一条清晰的工程化路线:
Agent 的核心不是“更聪明”,而是“更稳定地在环境中行动,并能持续自我修正”。
这要求产品、组织、工程与模型设计在同一系统逻辑下协同演进。
关键词(Keywords)
AI Agent;Long Horizon;Context Embedding;Action Space;ReAct Loop;Collective Feedback;PMF;工程化 AI