纪元117:罗马和平中文试玩版
42.7G · 2025-09-10
一、从超市监控说起:数据库的“时光回溯术”
想象一下这样的场景:作为超市经理,当顾客抱怨结账排队太久时,你会怎么做?
ASH(Active Session History) 正是数据库世界的“智能监控系统”。它像一位不知疲倦的记录员,每秒拍摄一张数据库的工作快照,帮你:
这个神奇的 “月光宝盒” 藏在 OceanBase 的 v$ob_active_session_history
视图中,等待你的探索。
我们准备了三个零基础实验,让你快让你快速感受 ASSH 的魅力:
让我们看看数据库最近 10 秒在忙什么:
-- 查看系统中最近 10 秒钟的运行状况SELECT sample_time AS 时间, -- 精确到微秒的时间戳 session_id AS 会话 ID, -- 唯一标识会话的 ID CASE WHEN session_state = 'ON CPU' THEN'工作中' ELSE '等待中' END AS 状态, -- 工作状态:CPU 忙碌或等待资源 event AS 等待原因 -- 具体的等待事件(如锁、I/O 等)FROM v$ob_active_session_historyWHERE sample_time > now() - 10 -- 最近10秒钟AND session_type = "FOREGROUND"ORDER BY sample_time DESC;
可能看到的结果:
+----------------------------+------------+----------+------------------------+| 时间 | 会话ID | 状态 | 等待原因 |+----------------------------+------------+----------+------------------------+| 2025-03-11 20:16:15.307564 | 3221931170 | 等待中 | px loop condition wait || 2025-03-11 20:16:14.285204 | 3221928286 | 工作中 | || 2025-03-11 20:16:14.285204 | 3221923503 | 等待中 | wait in request queue || 2025-03-11 20:16:14.285204 | 3221923627 | 等待中 | db file data read || 2025-03-11 20:16:14.285204 | 3221927472 | 等待中 | sync rpc || 2025-03-11 20:16:13.262695 | 3221929034 | 工作中 | || 2025-03-11 20:16:12.240768 | 3221927472 | 工作中 | |+----------------------------+------------+----------+------------------------+
我们发现:
找出最近 10 分钟的忙碌的会话:
-- 统计最近 10 分钟最活跃的会话SELECT session_id AS 会话ID,COUNT(*) AS 工作秒数FROM v$ob_active_session_historyWHERE sample_time > now() - 600 -- 最近 10 分钟 AND session_type = 'FOREGROUND'GROUP BY session_idORDER BY 工作秒数 DESC limit 3;
典型输出:
+------------+--------------+| 会话ID | 工作秒数 |+------------+--------------+| 3221977564 | 283 || 3221972645 | 142 || 3221916432 | 77 |+------------+--------------+
我们发现,会话 3221977564 在过去 10 分钟里活跃了 283 秒。如果过去时段只有这三个 session,那么会话3221977564
产生了数据库283 / (283 + 142 +77) = 56%
查看过去一段时间最繁忙的 sql。
-- 查询过去时间段中,执行负载最高的 sql_idSELECT SQL_ID,COUNT(*) AS 工作秒数FROM v$ob_active_session_history WHERE sample_time BETWEEN '2025-03-11 10:32:08' AND '2025-03-11 11:32:07' -- 可修改时间为实际想观察的时段GROUP BY sql_idORDER BY 工作秒数 DESClimit3;
+----------------------------------+--------------+| SQL_ID | 工作秒数 |+----------------------------------+--------------+| 1D0BA376E273B9D622641124D8C59264 | 91265 || 19AAD9F2FE3CE0023298AB83F7E75775 | 13608 || 7BE7497CCCFE8978AD6B92A938D43929 | 13098 |+----------------------------------+--------------+
ASH 就像数据库的自动录像机,每秒都会给所有正在工作的会话(比如执行 SQL 的会话)拍摄状态快照,这些快照都存储在 v$ob_active_session_history
这个系统视图中。
具体的实现原理如下:
db file data read
)每个 observer 内部,有一个专门的 ASH 线程,以 1 秒为周期,访问数据库内全部活跃会话,并记录其状态,其中:
ASH 快照数据保存在 30MB 的循环缓冲区。存储数据超过 30MB 后,会自动覆盖最旧的数据。我们从 4.2.5.3 版本开始实现了覆盖前 ASH 数据自动归档为 WR 的功能。但在之前版本,仍有可能出现 ASH 历史数据丢失,当我们希望保存最新的 ASH 记录时,可以手动触发 WR 快照:
-- 手动触发 WR 快照CALL DBMS_WORKLOAD_REPOSITORY.CREATE_SNAPSHOT();
执行该命令后,当前时刻还未持久化到 WR 中的 ASH 快照数据以 10:1 的比例持久化。
可能有以下两种原因:
OceanBase 会自动将 ASH 数据压缩保存到 WR 历史库中,只需查询 dba_wr_active_session_history
(系统租户查询视图 cdb_wr_active_session_history
)视图即可。虽然细节有所精简,但关键信息都保留了下来。
有关 WR 更多信息可以查看 OceanBase 官网文档 —— WR 概述[1]。
ASH 在 OceanBase 数据库中是常开的,对数据库性能的影响微乎其微(通常不到 1% 的 CPU 消耗),ASH 会恒定占用每个observer 进程 30MB 内存。
在第二篇中,我们将化身 "数据库侦探",使用 ASH 四维分析法破解这些谜团:
[1]
OceanBase 官网文档 —— WR 概述:
最后为大家推荐这个 OceanBase 开源负责人老纪的公众号「老纪的技术唠嗑局」,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注!
「老纪的技术唠嗑局」不仅希望能持续给大家带来有价值的技术分享,也希望能和大家一起为开源社区贡献一份力量。如果你对 OceanBase 开源社区认可,点亮一颗小星星✨吧!你的每一个Star,都是我们努力的动力。