上周 AI 圈事情不少。飞书和企业微信前后脚开源了 CLI 工具,Anthropic 发版时不小心把 Claude Code 的源码全漏了出去,智谱、阿里、Google 三家赶着发新模型,OpenAI 把 Codex 做成了 Claude Code 插件。

飞书和企业微信同日开源 CLI

3 月 28-29 日,飞书和企业微信各自开源了命令行工具,目的一样:让 AI Agent 能直接操作办公平台。

飞书 CLI(lark-cli)覆盖 12 个业务域,包括消息、文档、表格、日历、邮箱、任务、知识库等。和直接调 API 不同,它针对 AI Agent 做了不少适配:报错信息会提示怎么修,缺权限时自动引导补授权,Token 消耗也做了优化。

npm install -g @larksuite/cli
npx skills add  -y -g
lark-cli config init --new

已经适配 Claude Code、Trae、Cursor、Codex 等工具。一个有意思的功能是 Wake Word,可以在会议中用触发词让 Agent 从妙记里识别指令并执行。

企业微信 CLI(wecom-cli)覆盖面小一些,开放了消息、日程、文档、智能表、会议、待办、通讯录 7 个能力。走的是长连接机器人模式,授权后以用户身份操作。

npm install -g @wecom/cli
npx skills add WeComTeam/wecom-cli -y -g
wecom-cli init

限制也不少:目前只面向 10 人及以下企业开放,授权了 CLI 的机器人仅创建者可对话。官方自己也提醒了 AI 幻觉带来的数据泄露风险,建议先在测试企业里跑跑看。

两者放一起看:

维度飞书 CLI企业微信 CLI
覆盖业务域12 个7 个
使用限制无限制10 人以下企业优先
认证方式用户身份 + 应用身份长连接机器人
特色AI 优化的错误提示、妙记逐字稿用户身份操作、权限隔离

飞书在功能完整度和开放程度上领先不少。

Claude Code 源码泄露

3 月 31 日,Anthropic 往 npm 发布 Claude Code v2.1.88 时,忘了删 source map 文件。这个 59.8 MB 的 .map 文件里,sourcesContent 字段塞着完整的 TypeScript 源码——约 1900 个文件,超过 51.2 万行代码。

泄露的源码里能看到:

  • 架构基于 React + Ink 构建 TUI 界面,跑在 Bun 上
  • 多 Agent 编排、上下文处理、工具调用的完整逻辑
  • 系统提示词和工具定义全部公开

还有两个没公开的功能被扒了出来:

  • KAIROS:一个带 feature flag 的"永远在线"守护进程,做内存整合和主动任务处理,看起来是在探索跨会话的长期记忆
  • BUDDY:终端里的赛博宠物,Tamagotchi 风格,有 CHAOS、SNARK 这些属性和进化机制

Anthropic 表示是人为发布失误,没有客户数据、凭证或模型权重泄露。后续通过 DMCA 投诉封了外泄的代码仓库。

Claude Code 新功能:Computer Use 与无闪烁渲染

Claude Code 本身也在出新东西。

Computer Use 让 Claude 可以操作桌面环境:截屏、点鼠标、打字、在 GUI 和浏览器里导航。目前只支持 macOS,需要 Pro 或 Max 订阅,通过 /mcp 菜单启用。启用后要给辅助功能和屏幕录制两个权限。

OSWorld 基准测试上跑到了 72.5% 的成功率。适合拿来对付那些没有 API 的老系统、做 GUI 测试、跨系统搬数据。

无闪烁渲染(NO_FLICKER 模式)在 v2.1.88 加入,把终端切到备用屏幕缓冲区,和 vim、htop 一个原理。长对话时不再跳屏,内存也更稳定,还支持鼠标点击。

export CLAUDE_CODE_NO_FLICKER=1

BUDDY 宠物系统 4 月 1 日上线,愚人节彩蛋。18 种物种、5 级稀有度,基于用户 ID 哈希确定性生成——同一个账号永远抽到同一只。因为结果因人而异,不少人在社交媒体上晒自己抽到了什么,搞出了一波"全民抽卡"的氛围。

三大模型集中发布

智谱 GLM-5.1

3 月 27 日发布。基于 GLM-5 做的后训练改进,744B 参数 MoE 架构,全程跑在华为昇腾 910B 上,没用英伟达的卡。编程评测从 35.4 分涨到 45.3 分,大约是 Claude Opus 4.6 得分(47.9)的 94.6%。计划以 MIT 许可证开源权重。

阿里 Qwen3.6-Plus

4 月 2 日发布。混合 MoE 架构,原生支持 100 万 Token 上下文。SWE-bench Verified 拿了 78.8%,Terminal-Bench 2.0 上 61.6% 排第一。新加了 preserve_thinking 参数,在跨 Agent 循环时保持推理一致性。

已接入 Claude Code、Cline,上线了 Fireworks AI 和 OpenRouter。后面还有 Qwen3.6-Max。

Google Gemma 4

4 月 2 日发布,四个版本:

模型参数量特点
E2B约 20 亿激活手机/IoT,支持音频输入
E4B约 40 亿激活手机/IoT,支持音频输入
26B MoE260 亿总参数/38 亿激活低延迟
31B Dense310 亿稠密最高质量,适合微调

31B 在 Arena AI 排行榜上排开源模型第 3,打赢了不少体量大 20 倍的模型。许可证改成了 Apache 2.0,这是被社区反馈推着改的。支持 140+ 语言,上下文最长 256K,视觉和音频多模态原生支持。31B 未量化可以在单张 80GB H100 上跑,量化后消费级 GPU 也能用。

OpenAI Codex 代码审查插件

OpenAI 把 Codex 做成了 Claude Code 的插件 codex-plugin-cc,3 月 31 日发布 v1.0.2,已有 11.1k Star。

几个主要命令:

  • /codex:review:标准代码审查,只读分析未提交的变更
  • /codex:adversarial-review:对抗性审查,专门质疑实现方案,可以聚焦认证、数据丢失、竞态条件等
  • /codex:rescue:把任务丢给 Codex,让它去查 Bug、试着修
  • /codex:status / /codex:result:跟踪后台任务

Review Gate 功能启用后,Claude 每次响应前都会先过一遍 Codex 审查,有问题就拦住——等于多了一层自动 code review。

需要 ChatGPT 订阅(含免费版)或 OpenAI API key。

小结

CLI 工具在往办公平台渗透,模型厂商在 Agent 能力上你追我赶,OpenAI 直接在竞品生态里开店。Claude Code 那次源码泄露虽然是事故,倒是让人看到了现在 AI Coding 工具的工程复杂度有多高。KAIROS 和 BUDDY 这两个隐藏功能,前者指向"永远在线的 AI 助手",后者纯粹是给码农枯燥的终端生活加点乐子。


本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:alixiixcom@163.com