秋华点击器2.0
24.70M · 2026-02-09
上下文压缩是AI Agent工程中的高风险操作——它是有损且不可逆的。一旦关键信息在压缩过程中丢失,系统将无法恢复,可能导致后续决策链条的全面偏差。
Manus联合创始人Peak Ji提出的核心方法论:高质量的摘要不是让模型"写摘要",而是让模型"填表格";处理大工具输出不是无脑透传,而是场景化的策略选择。这一工程实践为我们提供了确保信息保真度的系统化路径。
"请总结以下内容..."
核心问题:
定义结构化表单,让AI精确填充字段:
┌─────────────────────────────────────────┐
│ Task Summary │
├─────────────────────────────────────────┤
│ 用户原始目标 │ [必须] 原文核心诉求 │
│ 当前子目标 │ [必须] 当前聚焦任务 │
│ 已修改文件 │ [可选] 文件路径列表 │
│ 已做关键决策 │ [必须] 决策+理由 │
│ 当前阻塞点 │ [必须] 无/具体问题 │
│ 下一步明确行动 │ [必须] 可执行步骤 │
└─────────────────────────────────────────┘
范式转移的本质:
| 维度 | 自由摘要(创作) | Schema填表(抽取) |
|---|---|---|
| 问题类型 | 语言生成(Generative) | 信息抽取(Extractive) |
| 信息覆盖 | 不确定 | 强制覆盖(字段必填) |
| 输出稳定性 | 低 | 高(结构固定) |
| 下游可解析性 | 差 | 极强(结构化数据) |
| 版本演进 | 不可控 | 可演进(Schema显式变更) |
| 错误定位 | 困难 | 精确(字段级监控) |
Schema的工程价值:
当工具返回海量Token时, "完整返回"与"即时处理"存在根本张力。Peak提出场景化的策略选择框架。
开始
│
├── 工具输出经预处理后长度 < 阈值(如4K tokens)?
│ └── 否 → 强制预摘要或子Agent封装(策略二)
│ └── 是 → 继续判断
│
├── Agent需要立即处理(非暂存备用)?
│ └── 否 → 立即卸载到文件系统,返回指针
│ └── 是 → 策略一:先完整返回 + 保险措施
│
└── 信息时效性高(延迟处理会贬值)?
└── 否 → 考虑批量异步处理
└── 是 → 确认策略一
关键认知:策略一的"完整返回"是有边界的,不是无脑透传原始输出。
适用条件(三者缺一不可):
三层过滤机制:
Layer 1: 工具层预处理(必须)
├── 爬虫:只取正文,去广告/导航/页脚
├── 搜索:只取Top-K(如10条),非全部1000条
└── 数据库:分页+字段筛选,非SELECT *
Layer 2: 策略决策
└── 预处理后长度 < 阈值 → 进入策略一
Layer 3: 系统级压缩(未来时刻)
└── 原始结果 → 压缩为指针(但关键洞见已保险持久化)
保险措施:对冲"延迟压缩"的不确定性
风险场景:
完整返回 → Agent还未处理 → 系统提前压缩(因窗口压力)→ 信息丢失
保险机制:
完整返回 → Agent立即提取洞见 → 主动write工具写入文件
└── 即使原始信息被提前压缩,洞见已安全
关键设计:指示模型"立即提取并持久化关键认知",而非保存完整原文
保险措施的写入内容:
| 场景 | 写入内容 |
|---|---|
| 搜索返回10篇论文 | "3篇核心论文+各自贡献+与当前任务相关性" |
| 数据库查询结果 | "统计摘要+异常点+需要深入调查的ID列表" |
| API返回监控数据 | "关键指标变化+阈值告警+建议排查方向" |
适用场景:
架构设计:
主Agent上下文(干净、高效)
├── 调用:advanced_search("AI Agent上下文工程最新进展")
│ ↓
│ ┌─────────────────────────────────────┐
│ │ 子Agent(独立工作流) │
│ │ • 自主决定搜索策略(多源、多轮) │
│ │ • 内部完成整合、去重、验证 │
│ │ • 输出:固定Schema的结构化结果 │
│ └─────────────────────────────────────┘
│ ↓
└── 接收:{热点话题, 关键数据, 趋势判断, 信息来源}
效果:主Agent上下文极其干净,复杂性完全封装
策略对比:
| 维度 | 策略一:先完整返回 | 策略二:子Agent封装 |
|---|---|---|
| 调用次数 | 1次(即时) | 多次(子Agent内部) |
| 延迟特性 | 即时响应 | 有延迟 |
| 主Agent上下文 | 临时膨胀,后压缩 | 始终干净 |
| 信息保真度 | 依赖保险措施 | 子Agent内部保障 |
| 工程复杂度 | 低 | 高(需设计子Agent) |
| 模式 | 流程 | 调用次数 | 延迟 | 适用场景 |
|---|---|---|---|---|
| 立即卸载 | search→卸载→指针→read_file→内容→处理 | 2次 | 高 | 复杂查询,非即时处理 |
| 先返回原文 | search→内容→立即处理 | 1次 | 低 | 简单搜索,即时决策 |
核心权衡:
Manus实践与LangChain WSCI框架的深度对应:
| Manus实践 | WSCI操作 | 作用 |
|---|---|---|
| Schema结构化摘要 | Write(写入) | 抢占式持久化关键信息 |
| 工具层预处理(Top-K、筛选) | Select(选择) | 前置过滤,控制输入规模 |
| 延迟压缩 + 保险措施 | Compress + Write | 效率与保真度的平衡 |
| 子Agent封装复杂性 | Isolate(隔离) | 上下文空间隔离,主Agent保持干净 |
关键洞察:保险措施本质是在Compress之前preemptively执行Write,确保关键信息在压缩发生前已安全持久化。
Peak Ji的方法论揭示了AI Agent工程的核心原则:
1. 摘要不是创作,是抽取 —— 用Schema约束确保保真度
2. 压缩有风险,主动写入来对冲 —— 用机制设计防丢失
3. 场景决定策略 —— 没有银弹,只有权衡
4. 复杂性要封装 —— 子Agent隔离,主Agent保持干净
5. 效率与安全的平衡 —— 即时性价值高时,用保险措施对冲风险
这些"充满权衡的工程智慧",正是从Demo走向生产系统的关键能力。
摘要、压缩、大工具输出,本身都不复杂。 真正难的是:
Manus 的经验给了我们几个极其重要的原则:
1. 摘要不是创作,是抽取 —— 用Schema约束确保保真度
2. 压缩有风险,主动写入来对冲 —— 用机制设计防丢失
3. 场景决定策略 —— 没有银弹,只有权衡
4. 复杂性要封装 —— 子Agent隔离,主Agent保持干净
5. 效率与安全的平衡 —— 即时性价值高时,用保险措施对冲风险
当 Agent 从 Demo 走向生产系统, Context Engineering 本身,就成了一门架构设计学。