C++成员函数如何工作?this指针、name mangling 成员函数指针解析

0.引言

在C++面向对象编程中,成员函数是对象行为的核心载体。我们每天都在使用成员函数,但却很少深入思考其底层的实现机制:为什么成员函数可以直接访问成员变量?编译器如何区分不同类的同名函数?静态成员函数为什么不能直接访问非静态成员?可不可以使用空指针去调用成员函数?为了解答这些问题,本文将从底层原理出发,解析成员函数和对象的关联机制,this指针的本质,名称修饰的作用,静态成员函数的特殊性,以及成员函数指针的实现细节。通过本文,读者不仅可以找到这些问题的答案,还可以掌握C++对象模型的深层原理。

1.成员函数如何与对象关联

我们知道对于成员函数来说,其属于类,所有对象共享一份函数代码(存储在代码段),但需要访问不同对象的数据,那么它们之间是如何关联的呢?想明白这个我们首先要知道这个关联指的是什么,一个函数要被调用那么我们关注的就是调用方式,而一个函数要访问一个数据我们则关注访问权限,下面将从一个例子来说明这两个方面的关联。

class Person {
private:
    string name;
public:
    void setName(const string& n) { name = n; }
};


Person a, b;
a.setName("Alice");
b.setName("Bob");

在上面例子中,a和b各自有自己的name变量,但其却可以使用同一个函数去设置,这就涉及到其调用方式,编译器在编译过程中隐式增加了一个参数,传递this指针(下一节详细讲述this指针),这个验证我们在下面第五节会详细验证;另外对于数据访问权限,这个会在编译期进行类成员状态(私有公有)以及访问它的方法进行检查,不满足的直接报错。

既然是传递了this指针,那么我们可以做个实验是不是在调用前进行检查,看看能不能预防宕机,答案是可以,当然,这个有的编译器并不支持,不太推荐使用。

class Foo {
private:
    int x;
public:
    void setX(int val) 
    { 
        if(nullptr == this)
        {
            return;
        }
        x = val; 
    }
};
int main() {
    Foo* f = nullptr;
    f->setX(42);  
    return 0;
}

2.this指针的实现细节

了解了成员函数和对象的关联方式(就是通过this指针传递),接下来我们来看这个关联的核心(this指针)到底是什么,this指针本质上是一个指针常量,用于指向调用该成员函数的对象地址。其在成员函数开始前计算,在成员函数结束后清除,且禁止修改。我们可以看一下其汇编代码。

class Foo {
private:
    int x;
public:
    void setX(int val) { x = val; }
};
int main() {
    Foo f;
    f.setX(42);  
    return 0;
}

其汇编代码如下(只截取f.setX的对应部分)

leaq    -12(%rbp), %rax ; 计算地址(对象地址)
movl    $42, %esi       ; 参数 val = 42
movq    %rax, %rdi      ; 第一个参数(this 指针)
call    _ZN3Foo4setXEi  ; 调用 Foo::setX(int)

3.名称修饰(Name Mangling)机制

要了解名称修饰的机制,首先要明确为什么需要名称修饰。对于C++来讲,其允许函数重载(同函数名不同参数),和类内的同名成员函数,但是链接器是通过名字来识别函数的,所以就需要一种机制来区分这些函数,由此产生了这个名称修饰(Name Mangling)。

那么名称修饰是如何做的那,这时候我们就需要来看一下其修饰规则了,以GCC为例,我们还是看Foo的代码,编译后使用readelf -s查看符号信息。

_Z:前缀
N:命名空间 / 类开始
3Foo:类名Foo,长度为 3
4setX:函数名setX,长度为 4
E:类 / 命名空间结束
i:参数类型为int

这是C++的修饰规则,C语言是不支持的,所以在C++中调用C语言需要加上extern "C"。

extern "C" {
    void c_function(int x);  // 按C语言规则编译,名字不被修饰
}

4.静态成员实现

静态成员在底层来说更接近于“带类作用域的全局函数”,其不会传递this指针,也就是说不会给rdi寄存器赋值,所以也就不能直接访问别的对象数据。

5.成员函数指针的实现

成员函数因为在底层也就是一个普通的函数,只是编译器添加了this指针,所以我们也可以通过获取函数地址的方式手动传递this来调用。我们来看一个例子,分别以直接获取和bind方式直接调用成员函数:

#include <iostream>
#include <functional>
class MyClass {
public:
    void memberFunc(int x) {
        std::cout << "Member function called, x=" << x 
                  << ", this=" << this << std::endl;
    }
};
// 定义与成员函数底层签名匹配的普通函数类型
using MemberFuncType = void(*)(MyClass*, int);
int main() {
    MyClass obj;
    
    // 获取成员函数指针(注意语法)
    void (MyClass::*memPtr)(int) = &MyClass::memberFunc;
    
    // 将成员函数指针强制转换为普通函数指针
    auto rawFunc = reinterpret_cast<MemberFuncType>(memPtr);
    
    // 以普通函数方式调用,显式传入 this
    rawFunc(&obj, 123); // 等价于 obj.memberFunc(123)
    // 将成员函数绑定到对象,生成一个无参的普通函数
    auto boundFunc = std::bind(&MyClass::memberFunc, &obj, std::placeholders::_1);
    
    // 以普通函数方式调用
    boundFunc(456); // 等价于 obj.memberFunc(456)
    
    return 0;
}

RTTI相关推荐阅读:C++ 对象模型:RTTI 的实现原理与类型识别机制

相关文章

cython如何调用C语言的函数?_c 中如何调用python

在 Cython 中调用 C 语言函数主要通过以下几种方式实现:1. 使用 cdef extern 声明外部 C 函数基本语法cdef extern from "头文件.h":返回类型...

C/C++函数调用的奥秘_c++函数调用原理

在C/C++编程的世界里,函数调用是程序运行的核心机制之一。然而,许多程序员在日常开发中,往往只关注代码的逻辑,而忽略了函数调用背后的底层细节。今天,就让我们一起深入探索C/C++函数调用的全过程,从...

C语言入门:学生成绩管理程序的完善(1):用文件保存数据

这是C语言入门的第27篇文章。今天讲学生成绩管理程序的完善:怎样利用文件来保存数据。还是昨天的问题:我怎么知道一个文件的内容是什么?我怎么知道比如一行有多少个数,多少个数以后是换行?这是因为文件是我们...

C语言应用笔记:常用的printf打印输出不同类型数据

我叫程序员阿虾, 在终端前摸过太多凌晨, 熟悉printf这一行字带来的安心与危险。今天想跟你聊聊我踩过的坑, 和一些别人不常说的细节, 用第一人称把经验交给你, 有点唠叨, 希望你少走弯路。为什么要...

C语言应用笔记:简单的最大最小值比较

使用宏定义实现泛型比较函数,用于求取两个值的最大值和最小值。核心宏定义解析#define MAX(x, y) ((x) > (y) ? (x) : (y)) // 返回两个值中较大的一个 #de...