您的位置: 首页> C++教程

虚函数进阶答疑：把上一篇博客评论区里最容易卡住的问题，一次追到底

匿名上传

发布时间:2026-03-12 18:12:01

这篇文章不是“虚函数基础知识”的重讲，而是我上一篇虚函数入门博客的评论区答疑与进阶复盘。

上一篇我主要做了 5 件事：先把虚函数的地图画出来，再去 VS 里看虚调用指令，再去 IDA 里把 vtable / vptr / RTTI 直接扒出来确认，最后把构造/析构虚调用和 dynamic_cast 的基本闭环跑通。

但写完之后，评论区里真正把我往前推了一步的，不是“virtual 是什么”这种题，而是这些更深的问题：

构造/析构里为什么只能按当前层分派？
vptr 到底是什么时候写进去、什么时候回退的？
构造/析构里的虚调用，底层到底还走不走“查表”？
vtable 为什么通常放只读区？
虚调用对 cache 的影响到底该怎么说，才不空泛？
为什么 Google C++ Style 明确不鼓励 RTTI？
为什么成员函数模板不能是虚函数？
vtable 到底是在编译期、链接期还是运行期确定的？

所以这一篇，我不再按“入门概念”写，而是按“评论区问题 → 我的修正理解 → 我怎么把它和反汇编/IDA 对上”来写。

整篇我尽量保持一个固定节奏：

1. 构造/析构期间虚调用为什么只按“当前层”分派

这个问题是我觉得最值得彻底讲透的。

C++ 标准在 [class.cdtor] 里写得很明确：
如果一个虚函数是在构造函数或析构函数里被调用，而且调用对象正是这个“正在构造或析构的对象”，那么被调用的不是更派生类里的 override，而是“当前这个构造函数/析构函数所属类”中的 final overrider。也就是说，在 Base::Base() 或 Base::~Base() 里发起的这种虚调用，不会越级跑到 Derived::f() 去。

我现在对这件事的理解，不再是“背规则”，而是先抓住它背后的对象生命周期：

构造时：派生部分还没真正构造完成；
析构时：派生部分已经先被销毁掉了。

所以如果在 Base 阶段还去调用 Derived 版本，就可能读到未初始化成员，或者访问已经析构的资源。标准同一节其实也强调了：在构造开始前去引用对象成员/基类，或者在析构完成后再去引用，都是未定义行为；这正好和“为什么不能越级分派”是同一条逻辑。

所以我现在会把这个问题压成一句很短的话：

这句话是这篇文章后面很多问题的总前提。

2. `vptr` 到底什么时候初始化？析构时又什么时候“回退”？

这个问题如果只从语言层面说，很容易抽象；但一旦和反汇编连起来，就会立刻具体起来。

我现在会先把“反初始化”这个词换掉。更准确的说法不是“析构时把 vptr 反初始化/清零”，而是：

在构造阶段，典型过程是：

进入 Derived::Derived；
先调用 Base::Base；
在 Base::Base 开头附近把对象头里的 vptr 写成 Base 的 vtable；
Base::Base 返回后；
回到 Derived::Derived，再把同一个位置改写成 Derived 的 vtable。

Itanium ABI 在“对象构造期间的虚表”一节说得非常直白：对象在构造各个 proper base subobject 时，会“暂时表现成”那个 base；通常这个行为就是通过在 base 构造函数里，把对象的 virtual table pointer 设到该 base 视角对应的 virtual table 来实现的。遇到虚继承时，还可能用到 construction virtual table 和 VTT。

而在析构阶段，我现在的答案是：

微软 __declspec(novtable) 的文档，反过来把这件事说得很清楚：这个属性会阻止编译器在类的构造函数和析构函数里生成初始化 vfptr 的代码。换句话说，正常情况下，MSVC 本来就会在 ctor/dtor 里做和 vfptr 相关的初始化/切换工作。

这也是为什么我现在不再把“构造/析构按当前层分派”和“vptr 改写时机”当成两个孤立知识点。它们其实是一件事的两面：

语言规则：当前层分派；
常见实现：构造/析构过程中分阶段改写 vptr。

3. 构造/析构里调用虚函数，底层一定还走“查虚表 → 间接 call”吗？

这个问题我一开始想得太机械了，总觉得“既然是虚函数，就一定要查表”。后来我才把“语义”和“机器码实现”区分开。

标准真正规定的是：

它规定的是“当前层的 final overrider”，不是“机器码必须先读 vptr 再查表再间接跳”。

所以在很多简单场景下，编译器完全可以直接生成：

call Base::f

或者：

call Derived::f

而不必再绕一次完整的“虚调用路径”。因为在构造/析构体里，当前层该调谁这件事，语义上已经确定了。

所以我现在对这个问题的回答是：

这里我会特地补一句，免得说太死：

复杂继承、虚继承、construction vtable 这些情况，编译器仍然可能借助更复杂的表机制来保证当前层语义。Itanium ABI 专门有 construction virtual table 这一节，就是在处理“正常 vtable 不足以正确服务构造/析构期对象模型”的那些情况。

所以这个问题我现在记成一句话：

4. 为什么现实里 vtable 通常放在只读区，而不是代码段？

这个问题很容易一上来就答成“因为不能被篡改”，但那只是答案的一部分。

我现在会先纠正一个前提：

“vtable 在哪儿”是 ABI 和编译器实现问题，不是语言标准本身的硬性规则。Itanium ABI 只规定了虚表里会有哪些组成项、怎么布局，并没有把“必须在 .rodata”写成语言条文。

那为什么现实里它通常放只读区，或者至少是“重定位后只读”的区域？

因为：

第一，它本质上更像“数据表”，不是代码

Itanium ABI 写得很清楚，vtable 里不只有函数入口，还可能有：

vcall offsets
vbase offsets
offset-to-top
RTTI 信息
虚函数指针或调整 thunk 入口

而且它还专门区分了“address point”和“整个虚表起始位置”——对象里的 vptr 指向的并不一定是整张表开头，而是某个地址点。

这说明它本质上不是“一段代码”，而是一份类级元数据表。

第二，它通常在运行时主要是只读的

同一个类的大量对象会共享同一份 vtable。既然它是共享元数据，而且运行时主要做读取，不做普通业务意义上的修改，那放到只读区就最自然。

第三，只读更安全

这个是你一开始直觉里抓到的部分：
如果 vtable 可写，那么虚调用目标就更容易被内存破坏或恶意篡改。放在只读区，至少从权限模型上更合理。

所以我现在会把这个问题压成一句特别顺的话：

这句话一成立，“为什么更适合放只读区”就顺了。

5. 虚调用到底怎么影响性能？“因为运行时调用所以无法缓存”对吗？

我现在觉得这个问题最容易答空，或者答错。

我一开始的直觉也是：

但后来我把这个说法修正成了：

LLVM 关于去虚化的资料里直接把 virtual call 写成了这种形态：

先 load vtable
再 load 虚函数入口
再 call 这个入口

而且它明确说了：去虚化很重要，因为更多内联机会，同时indirect calls are harder to predict。GCC 的优化文档也说明了，编译器会为了更激进的 devirtualization 打开额外信息和优化通路。

所以我现在会把性能问题拆成三层说：

1. 不是“缓存不了”

对象里的 vptr 可以被缓存，vtable 也可以被缓存，目标函数指令照样可以进 I-cache。
所以“运行时调用所以无法缓存”这个因果关系并不成立。

2. 多出来的是额外访存链路

普通直接调用更接近“目标地址已知”；
虚调用通常要经历：

对象 → vptr
vptr → vtable 槽位
槽位 → 目标函数地址

这会增加依赖性 load，可能带来额外的 D-cache 压力，但不是“一定命中率暴跌”。

3. 更大的问题常常是“难预测、难内联”

真正更常见的性能损失往往来自：

间接调用更难预测
编译器更难做去虚化
一旦不能去虚化，后面的内联和跨过程优化机会也少很多

所以我现在对这个问题的最短回答是：

6. 为什么 Google C++ Style 明确不鼓励 RTTI？

这个问题我现在不会再答成“因为 RTTI 不优雅”这么虚了。

Google C++ Style Guide 在 RTTI 一节的态度非常直接：
Avoid using run-time type information (RTTI).
它接着还写了一句我觉得特别关键的话：

原文甚至说得更重一些：这通常暗示 class hierarchy 的设计是 flawed 的；而无约束地使用 RTTI，会让代码到处长出“基于类型的 decision tree / switch”，最终导致维护困难。Google 同时也给了替代建议：优先用虚函数；如果逻辑本来就不该放在对象内部，可以考虑 double dispatch / Visitor。

所以我现在对 RTTI 的理解是：

这句话比“语言设计不完美”更接近工程现实。

我现在会这样概括：

少量 RTTI：可能是现实折中；
到处 dynamic_cast / typeid：往往说明原本该进多态接口的行为，被丢到了对象外部做按类型分支。

因此这个问题我现在的答法是：

7. 为什么成员函数模板不能是虚函数？

这是我后来特别喜欢的一道题，因为它很能区分“表面理解”和“本质理解”。

标准在 [temp.mem] 里直接规定了两件事：

成员函数模板不能声明为 virtual；
成员函数模板的特化也不会 override 基类虚函数。

我一开始的说法是：

这句话不算错，但不够本质。

更本质的说法是：

虚函数为什么能 override？
因为基类先给出一个确定签名，派生类再用相同签名去覆盖它，这样编译器才能在 vtable 里给这个接口安排固定槽位。

而模板函数在实例化前没有唯一签名：

f<int>
f<double>
f<std::string>

这些是不同实例，不是“同一个函数的不同运行时版本”。

所以真正冲突的不是“一个编译期、一个运行期”这么表层，而是：

没有唯一签名，就没有稳定 override 关系；没有稳定 override 关系，就没法给它安排确定的 vtable 槽位。

所以我现在会把这个问题记成一句很顺的话：

8. vtable 到底是在编译期、链接期还是运行期确定的？

这个问题我现在觉得，最重要的是把“确定”拆开。

因为“确定”至少有三层意思：

第一层：编译期，确定“它长什么样”

编译器看到类定义、继承关系、override 关系后，会决定：

这个类需不需要 vtable；
哪些槽位来自基类；
哪些被当前类覆盖；
是否需要 thunk；
表里还有没有 RTTI、offset 等信息。

Itanium ABI 明确说明了，虚表的 address point、offset-to-top、RTTI 字段、虚函数入口这些东西，都是虚表布局的一部分。

第二层：链接期，确定“最终由谁来正式提供”

GCC 的 Vague Linkage 文档把 vtable 放进一个很重要的类别里：
有些 C++ 实体在多个翻译单元里都可能出现候选定义，但最终程序里只保留一份。对 vtable 来说，如果类有非 inline、非 pure 的虚函数，GCC 会选第一个这样的函数作为 key method，并把 vtable 只发射到它定义所在的翻译单元；type_info 对象也会和 vtable 一起写出来，以支持 dynamic_cast 和 typeid。

这也是为什么我后来终于想明白了“链接阶段到底在做什么”：

第三层：运行期，确定“对象现在该指向哪张表”

运行期一般不是现算一张全新 vtable，而是：

对象构造时把 vptr 写到当前层对应的那张表上；
析构时再随着析构链推进，回退到当前层对应的表。

微软 novtable 文档正好从反面说明：如果你阻止编译器在 ctor/dtor 中生成 vfptr 初始化代码，那很多情况下连这张 vtable 的引用都会消失，链接器可能直接把它扔掉。

把流程压成 7 步，大概是这样：

第 0 步：先区分“语言规则”和“实现”

语言只说：虚调用要调用 dynamic type 上的 final overrider。
ABI/编译器才决定：我到底用 vtable、thunk、construction vtable 还是别的细节来实现。Itanium ABI 就是干这个的。

第 1 步：看到类定义，判断它是否需要 vtable

只要类声明了虚函数，或者继承了虚函数并保持多态性质，编译器就会把它当作需要动态分派的类来处理，并进入 vtable 相关布局计算。Clang 的 vtable 布局代码就是针对 CXXRecordDecl 做这件事。

第 2 步：计算类布局和继承结构

编译器先做对象布局：主基类、非虚基类、虚基类、子对象偏移、是否需要主/次 vtable、地址点等。Clang 的 record layout builder 里就有“lay out the vtable and the non-virtual bases”这样的步骤。

第 3 步：收集虚函数集合，建立覆盖关系

编译器要知道：

哪些虚函数从基类继承而来
哪些被当前类 override 了
哪些需要在当前类中替换槽位
多继承/虚继承下是否需要额外的 thunk 来调 this

Clang 的 computeVTableRelatedInformation 和 thunk 相关结构就是在处理这些问题。

第 4 步：确定 vtable 组件和槽位顺序

在 Itanium ABI 下，vtable 组件不只有函数指针，还有：

vcall offsets
vbase offsets
offset-to-top
RTTI/typeinfo 指针
各虚函数入口，必要时是 adjustor thunk 的入口

ABI 还定义了“address point”的概念：对象里的 vptr 不一定指向整张表最开头，而是指向某个地址点。

第 5 步：生成 vtable 的全局初始化器

编译器把上一步的布局结果变成真正的常量全局对象；Clang 里就是 createVTableInitializer 做这件事。

第 6 步：决定在哪个翻译单元发射

这是链接友好性问题。Itanium/GCC 规则里通常跟 key function 有关：
有 key function 时，vtable 通常只在那个定义所在翻译单元发射；没有时就走 COMDAT / vague linkage 路线。

第 7 步：构造对象时写入 `vptr`

对象真正被创建时，构造函数代码会把对象里的 vptr 设为当前层对应的 vtable 地址；析构时也会按当前层语义处理 vfptr。MSVC 官方文档直接把“在构造函数和析构函数里初始化 vfptr”当成正常行为来描述。

9. 我现在是怎么把这些问题串成一个闭环的

写到这里，我对“虚函数进阶”这部分的理解，已经和上一篇博客不太一样了。

上一篇我更多是在回答：

虚函数是什么；
普通调用和虚调用在 VS 反汇编里长什么样；
vtable / RTTI 在 IDA 里怎么找；
构造/析构虚调用和 dynamic_cast 的基本事实是什么。

这一篇我真正补上的，是这些“为什么”：

第一，构造/析构期间为什么只能按当前层分派

这不是一个孤立规则，而是对象生命周期安全性的直接结果。标准已经把这件事写死了；编译器再用分阶段改写 vptr 去落地它。

第二，`vptr` 的写入/回退不是独立知识点，而是“当前层语义”的实现

这件事一旦想通，构造/析构里的虚调用、typeid、dynamic_cast 为什么在当前层语义下工作，也都顺了。标准同一节其实把 typeid 和 dynamic_cast 在构造/析构期间的语义也一起规定了。

第三，虚函数相关问题一定要分层看

以后我再遇到类似问题，会先问自己三件事：

这是 标准语义 吗？
这是 ABI/编译器常见实现 吗？
这是 某个具体编译器 + 某个优化级别 + 某份反汇编 下的现象吗？

很多“看起来矛盾”的地方，其实都是这三层没分开。

10. 这篇答疑之后，我自己对虚函数的“进阶闭环”

到这里，我现在能把虚函数相关知识压成下面这条线：

换句话说，我现在不再把“虚函数”只看成：

一个 virtual 关键字；
一次“运行时多态”；
一张函数指针表。

而是更愿意把它看成：

这一篇就先收在这里。

本站提供的所有下载资源均来自互联网，仅提供学习交流使用，版权归原作者所有。如需商业使用，请联系原作者获得授权。如您发现有涉嫌侵权的内容，请联系我们邮箱:alixiixcom@163.com

节奏大师修改版2016年最新版

音乐舞蹈游戏节奏大师闯关

立即下载

虚函数进阶答疑：把上一篇博客评论区里最容易卡住的问题，一次追到底

1. 构造/析构期间虚调用为什么只按“当前层”分派

2. `vptr` 到底什么时候初始化？析构时又什么时候“回退”？

3. 构造/析构里调用虚函数，底层一定还走“查虚表 → 间接 call”吗？