弗兰的悲惨之旅
99.73M · 2026-04-04
上周 AI 圈事情不少。飞书和企业微信前后脚开源了 CLI 工具,Anthropic 发版时不小心把 Claude Code 的源码全漏了出去,智谱、阿里、Google 三家赶着发新模型,OpenAI 把 Codex 做成了 Claude Code 插件。
3 月 28-29 日,飞书和企业微信各自开源了命令行工具,目的一样:让 AI Agent 能直接操作办公平台。
飞书 CLI(lark-cli)覆盖 12 个业务域,包括消息、文档、表格、日历、邮箱、任务、知识库等。和直接调 API 不同,它针对 AI Agent 做了不少适配:报错信息会提示怎么修,缺权限时自动引导补授权,Token 消耗也做了优化。
npm install -g @larksuite/cli
npx skills add -y -g
lark-cli config init --new
已经适配 Claude Code、Trae、Cursor、Codex 等工具。一个有意思的功能是 Wake Word,可以在会议中用触发词让 Agent 从妙记里识别指令并执行。
企业微信 CLI(wecom-cli)覆盖面小一些,开放了消息、日程、文档、智能表、会议、待办、通讯录 7 个能力。走的是长连接机器人模式,授权后以用户身份操作。
npm install -g @wecom/cli
npx skills add WeComTeam/wecom-cli -y -g
wecom-cli init
限制也不少:目前只面向 10 人及以下企业开放,授权了 CLI 的机器人仅创建者可对话。官方自己也提醒了 AI 幻觉带来的数据泄露风险,建议先在测试企业里跑跑看。
两者放一起看:
| 维度 | 飞书 CLI | 企业微信 CLI |
|---|---|---|
| 覆盖业务域 | 12 个 | 7 个 |
| 使用限制 | 无限制 | 10 人以下企业优先 |
| 认证方式 | 用户身份 + 应用身份 | 长连接机器人 |
| 特色 | AI 优化的错误提示、妙记逐字稿 | 用户身份操作、权限隔离 |
飞书在功能完整度和开放程度上领先不少。
3 月 31 日,Anthropic 往 npm 发布 Claude Code v2.1.88 时,忘了删 source map 文件。这个 59.8 MB 的 .map 文件里,sourcesContent 字段塞着完整的 TypeScript 源码——约 1900 个文件,超过 51.2 万行代码。
泄露的源码里能看到:
还有两个没公开的功能被扒了出来:
Anthropic 表示是人为发布失误,没有客户数据、凭证或模型权重泄露。后续通过 DMCA 投诉封了外泄的代码仓库。
Claude Code 本身也在出新东西。
Computer Use 让 Claude 可以操作桌面环境:截屏、点鼠标、打字、在 GUI 和浏览器里导航。目前只支持 macOS,需要 Pro 或 Max 订阅,通过 /mcp 菜单启用。启用后要给辅助功能和屏幕录制两个权限。
OSWorld 基准测试上跑到了 72.5% 的成功率。适合拿来对付那些没有 API 的老系统、做 GUI 测试、跨系统搬数据。
无闪烁渲染(NO_FLICKER 模式)在 v2.1.88 加入,把终端切到备用屏幕缓冲区,和 vim、htop 一个原理。长对话时不再跳屏,内存也更稳定,还支持鼠标点击。
export CLAUDE_CODE_NO_FLICKER=1
BUDDY 宠物系统 4 月 1 日上线,愚人节彩蛋。18 种物种、5 级稀有度,基于用户 ID 哈希确定性生成——同一个账号永远抽到同一只。因为结果因人而异,不少人在社交媒体上晒自己抽到了什么,搞出了一波"全民抽卡"的氛围。
3 月 27 日发布。基于 GLM-5 做的后训练改进,744B 参数 MoE 架构,全程跑在华为昇腾 910B 上,没用英伟达的卡。编程评测从 35.4 分涨到 45.3 分,大约是 Claude Opus 4.6 得分(47.9)的 94.6%。计划以 MIT 许可证开源权重。
4 月 2 日发布。混合 MoE 架构,原生支持 100 万 Token 上下文。SWE-bench Verified 拿了 78.8%,Terminal-Bench 2.0 上 61.6% 排第一。新加了 preserve_thinking 参数,在跨 Agent 循环时保持推理一致性。
已接入 Claude Code、Cline,上线了 Fireworks AI 和 OpenRouter。后面还有 Qwen3.6-Max。
4 月 2 日发布,四个版本:
| 模型 | 参数量 | 特点 |
|---|---|---|
| E2B | 约 20 亿激活 | 手机/IoT,支持音频输入 |
| E4B | 约 40 亿激活 | 手机/IoT,支持音频输入 |
| 26B MoE | 260 亿总参数/38 亿激活 | 低延迟 |
| 31B Dense | 310 亿稠密 | 最高质量,适合微调 |
31B 在 Arena AI 排行榜上排开源模型第 3,打赢了不少体量大 20 倍的模型。许可证改成了 Apache 2.0,这是被社区反馈推着改的。支持 140+ 语言,上下文最长 256K,视觉和音频多模态原生支持。31B 未量化可以在单张 80GB H100 上跑,量化后消费级 GPU 也能用。
OpenAI 把 Codex 做成了 Claude Code 的插件 codex-plugin-cc,3 月 31 日发布 v1.0.2,已有 11.1k Star。
几个主要命令:
/codex:review:标准代码审查,只读分析未提交的变更/codex:adversarial-review:对抗性审查,专门质疑实现方案,可以聚焦认证、数据丢失、竞态条件等/codex:rescue:把任务丢给 Codex,让它去查 Bug、试着修/codex:status / /codex:result:跟踪后台任务Review Gate 功能启用后,Claude 每次响应前都会先过一遍 Codex 审查,有问题就拦住——等于多了一层自动 code review。
需要 ChatGPT 订阅(含免费版)或 OpenAI API key。
CLI 工具在往办公平台渗透,模型厂商在 Agent 能力上你追我赶,OpenAI 直接在竞品生态里开店。Claude Code 那次源码泄露虽然是事故,倒是让人看到了现在 AI Coding 工具的工程复杂度有多高。KAIROS 和 BUDDY 这两个隐藏功能,前者指向"永远在线的 AI 助手",后者纯粹是给码农枯燥的终端生活加点乐子。