点点工程机械
116.25M · 2026-04-01
让智能体"做一个 TODO 应用",它确实会做出点什么。问题在于,它经常做出来的东西驴唇不对马嘴,跑出预定范围,还反复犯同样的错误。
为了解决这些问题,早期出现了 AGENTS.md,近来又有了 Skills 这类结构化方案。但看看实际分享出来的 Skills,几个通病很明显:
最关键的库版本信息缺失。 角色描述止步于"You are a Senior engineer"之类的空话。 几个关键词就能讲清的内容,偏要写成长篇大论,白白浪费 token。
结果就是,模型既不能好好遵循这些 Skills,上下文也白白耗掉了,时间一长就变成了没人想打开的死代码。
oh-my-agent 想用流程而非提示词来解决这个问题。智能体出错时,不是简单地说一句"重来",而是记录它为什么出错,并在下一次执行中加以改进。
核心机制是 Clarification Debt(CD)计分。当智能体误解需求或越出范围时,会累积分数:
超过 50 分,必须编写 Root Cause Analysis(RCA);超过 80 分,会话直接中断。总结出的经验会沉淀到 lessons-learned.md,从下一次会话起立即生效。提示词写得再简单,流程也能帮你兜住。
除此之外,为了防止智能体自行其是,还设有几个通用协议:
Clarification Protocol — 将需求模糊度分为 LOW / MEDIUM / HIGH。LOW 直接推进,MEDIUM 给出选项,HIGH 停下来先把事情说清楚。
Difficulty Guide — 将任务划分为 Simple / Medium / Complex,按需调整协议深度。
Context Budget — 按模型设定 token 预算,减少不必要的上下文开销。
这种思路与 OpenAI 提出的 Harness Engineering 一脉相承。用好智能体,不是一句提示词能解决的,关键在于你用什么样的结构去管控它。
oh-my-agent 在项目目录内统一管理这些内容。
.agents/ = SSOT — 技能、工作流、配置全部放在 .agents/ 目录下,作为唯一可信数据源,不绑定任何特定 IDE。
基于角色的智能体团队 — 基础角色包括 PM、QA、Frontend、Backend、Mobile、Debug,本次新增了 DB Agent 和 TF Infra Agent。
以工作流为中心的编排 — 规划、评审、调试、并行执行构成基本流程。新增的 /brainstorm 工作流在写代码之前先做设计探索:代码库分析 → 澄清提问 → 方案建议 → 用户确认 → 保存设计文档,之后衔接 /plan → 实现。
/coordinate 追求速度——快速迭代,出了问题再修。PM 拆解任务、调度智能体,QA 做一轮评审。遇到 CRITICAL/HIGH 级别问题就重跑该任务,整体是一个轻量高效的 7 步循环。
/ultrawork 则强调质量把关。分为 PLAN → IMPL → VERIFY → REFINE → SHIP 五个阶段,每个阶段都有门禁,过不了就不能往下走。17 个步骤中有 11 个是评审;REFINE 阶段还会做文件拆分、去重、副作用分析和死代码清理。
看起来可能有些过头,但编程的抽象层级从机器语言到高级语言、再到自然语言一路攀升,验证只会变得越来越重要——相信大家对此不会有异议。
一个月前,这个项目以 oh-my-ag 的名字亮相,当时是 Antigravity 专属的编排器。但这段时间里,多个 AI IDE 开始把 .agents/skills/ 作为项目技能路径,继续绑定单一 IDE 已经没有意义。于是扩展为通用调控框架,更名为 oh-my-agent。
curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/main/cli/install.sh | bash
支持 Antigravity、Claude Code、Codex CLI、Cursor 等主流 AI IDE。
如果你已经在用 AI IDE,不妨试一试。说到底,开发者的目标是同时把控 QCD(Quality, Cost, Delivery)。智能体开发也不例外——oh-my-agent 就是带着这个信念做出来的。
GitHub: first-fluke/oh-my-agent