OpenClaw 原生架构的记忆依赖上下文历史拼接、工具调用读写本地文件,以及显式对话指令触发记忆。

这带来几个问题:
  • 检索算法简陋: 召回不稳定、相关性弱,Agent 需要反复试错与重问,Token 随对话轮次快速累积。
  • 上下文注入过量: 每次执行固定读取近两天全量记忆(today + yesterday)+ 长期记忆,缺乏按任务裁剪,导致无效上下文占比高。
  • 记忆缺少结构与去冗余: 工具调用的长输出(如 find 遍历、config.schema 等)被直接写入并在后续反复重传,成本呈滚雪球式放大。

最严重的是上下文爆炸,文件读写加上工具调用日志进入 prompt,导致 token 非线性增长。

原生 OpenClaw 本质是 Prompt 驱动型 Agent,记忆等于上下文,状态等于 token,长期能力等于上下文堆叠。而 OpenClaw + MemOS 转变为系统驱动型 Agent,记忆是系统层,状态是结构化存储,推理是状态调度加模型调用,Agent 从"会聊天的程序"转向"具备长期状态连续性的智能系统组件"。

本次测试,我们用公开数据集和真实任务对 OpenClaw 原生方案和 OpenClaw + MemOS 插件两个方案,对长期记忆能力、跨会话一致性、token 消耗与系统效率进行系统对比评测。

公开数据集测试(LOCOMO)

数据集说明

通过 LOCOMO(Long-Term Conversational Memory Benchmark),测试两类任务:

  1. 问答任务测精确召回能力,
  2. 事件摘要测长期语义整合能力。

评测通过 Gateway 启动两个 OpenClaw 端点版本:原生 OpenClaw、集成 MemOS 插件的 OpenClaw。

测试流程:

  1. 将数据集中的文本对话输入 OpenClaw,
  2. 再以数据集中的问题作为 query 进行提问,
  3. 对返回结果进行准确率评估,
  4. 并通过底层模型日志统计 token 使用量,从而同时评估记忆效果与系统成本。

全量测试结果

准确性方面,准确率从 0.2373 提升到 0.3168,说明长期对话的记忆稳定性明显增强。Agent 不再只靠上下文拼接做短期推理,而是有了结构化记忆调度能力。

成本方面,模型调用次数降低 59.5%,token 消耗降低 72%+。系统不再通过"堆 prompt"维持状态,而是通过记忆系统做状态抽取、结构化存储和按需激活。这是个重要转变:从"上下文记忆"到"系统记忆"。

真实任务测试(工程场景)

公开数据集只能验证模型能力上限,真实系统更关心工程行为:跨会话连续任务、复杂状态保持、长期协作交互。

我们构建了一组复杂真实任务流,测试跨会话任务连续性、多维度信息检索稳定性、记忆写入与召回效率,以及 token 成本随复杂度的增长趋势。

MemOS OpenClaw Plugin 通过自动记忆机制,让 Agent 的所有交互进入记忆系统,形成结构化存储和可调度状态。

工程实测对比

跨会话任务测试

集成 MemOS 后,对话轮次减少约 53%,token 消耗减少约 49%。

跨会话任务可以自然延续,无需用户反复重建上下文。不再出现"行为反转"、"偏好丢失"、"任务方向漂移"这些问题。

Agent 从"短期记忆型对话工具"转变为"具备长期状态连续性的协作系统"。

单会话记忆读写效率测试

在 OpenClaw 原生架构中,记忆读写依赖工具调用,本地文件操作产生大量不可控上下文污染,一次"写一句话"的操作能引入数千 token 的上下文膨胀。

MemOS 将记忆从"prompt 负担"转为"系统状态层",记忆不进入上下文堆叠而是按需激活注入,状态与对话解耦,记忆与推理解耦,从架构上阻断了 token 爆炸路径。

从工具到落地

Token 成本可控:从“全量灌上下文”变成“按任务精确召回”

OpenClaw 不再每次固定塞入 today+yesterday+ 长期记忆,而是由 MemOS 按当前任务检索最相关的少量记忆(可设定召回预算/条数),显著降低无效上下文占比,避免 Token 滚雪球。

检索更稳更准:减少反复试错与重问,提升一次命中率

MemOS 提供更强的记忆组织与检索能力(结构化、分层/多粒度、语义检索 + 规则过滤等),让 OpenClaw 召回的内容相关性更强、稳定性更高,减少 Agent 因“召回不稳”导致的重复推理与反复确认。

记忆更干净可用:结构化 + 去冗余 + 高压缩,避免“长输出污染”

工具调用的长输出(如遍历结果、config/schema 等)不会直接原样反复写入上下文;MemOS 可以做摘要/压缩、去重与归档,长期运行越用越“清爽”,记忆质量随时间提升而不是劣化。

在真实工程环境中,这带来可扩展性提升、token 成本可控、跨会话能力稳定、长期任务可持续,以及 Agent 行为一致性增强。


立即体验

Your lobster now has a working memory system.

Get your API key:

memos-dashboard.openmem.net/quickstart/…

Try it: Full tutorial

github.com/MemTensor/M…


关于 MemOS

MemOS 为 AI 应用构建统一的记忆管理平台,让智能系统如大脑般拥有灵活、可迁移、可共享的长期记忆和即时记忆。

作为记忆张量首次提出“记忆调度”架构的 AI 记忆操作系统,我们希望通过 MemOS 全面重构模型记忆资源的生命周期管理,为智能系统提供高效且灵活的记忆管理能力。

本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:alixiixcom@163.com