38. C++ 引用的本质

1. C++ 引用的本质

1.1 引用的底层实现方式

引用被称为变量的别名,它不能脱离被引用对象独立存在,这是在高级语言层面的概念和理解,并未揭示引用的实现方式。常见错误说法是“引用“自身不是一个变量,甚至编译器可以不为引用分配空间。

存放的是被引用对象的地址。

实际上,引用本身是一个变量,只不过这个变量的定义和使用与普通变量有显著的不同。为了解引用变量底层实现机制,考查如下代码:

int i = 5;
int &ri = i;
ri = 8;

在Visual Studio 2017环境的debug模式调试代码,反汇编查看源码对应的汇编代码的步骤是:调试->窗口->反汇编,即可得到如下原码对应的汇编代码:

int i = 5;
00A013DE  mov        dword ptr [i],5      # 将文字常量5送入变量i

int &ri = i;
00A013E5  lea        eax,[i]              # 将变量i的地址送入寄存器eax
00A013E8  mov        dword ptr [ri],eax   # 将寄存器的内容(也就是变量i的地址)送入变量ri

ri = 8;
00A013EB  mov        eax,dword ptr [ri]   # 将变量ri的值送入寄存器eax
00A013EE  mov        dword ptr [eax],8    # 将数值8送入以eax的内容为地址的单元中

return 0;
00A013F4  xor        eax,eax

考查以上代码,在汇编代码中,ri的数据类型为dword,也就是说,ri要在内存中占据4个字节的位置。所以,ri的确是一个变量,它存放的是被引用对象的地址。由于通常情况下,地址是由指针变量存放的,那么,指针变量和引用变量有什么区别呢?使用指针常量实现上面的代码功能。考查如下代码:

int i = 5;
int* const pi = &i;
*pi = 8;

按照相同的方式,在VS2017中得到如下汇编代码:

int i=5;
011F13DE  mov         dword ptr [i],5  

int * const pi = &i;
011F13E5  lea         eax,[i]  
011F13E8  mov         dword ptr [pi],eax 

*pi = 8;
011F13EB  mov         eax,dword ptr [pi]  
011F13EE  mov         dword ptr [eax],8  

观察以上代码可以看出:
(1)只要将pi换成ri,所得汇编代码与第一段所对应的汇编代码完全一样。所以,引用变量在功能上等于一个指针常量,即一旦指向某一个单元就不能在指向别处。
(2)在底层,引用变量由指针按照指针常量的方式实现。

(3)引用是一种更安全的指针,因为引用必须初始化,不会出现空指针或野指针

(4) 存在多级指针,但不存在多级引用

1.2 高级语言层面引用与指针常量的关系

(1)在内存中都是占用4个字节(32bits系统中)的存储空间,存放的都是被引用对象的地址,都必须在定义的同时进行初始化。

(2)指针常量本身(以p为例)允许寻址,即&p返回指针常量(常变量)本身的地址,被引用对象用*p表示;引用变量本身(以r为例)不允许寻址,&r返回的是被引用对象的地址,而不是变量r的地址(r的地址由编译器掌握,程序员无法直接对它进行存取),被引用对象直接用r表示。

(3)凡是使用了引用变量的代码,都可以转换成使用指针常量的对应形式的代码,只不过书写形式上要繁琐一些。反过来,由于对引用变量使用方式上的限制,使用指针常量能够实现的功能,却不一定能够用引用来实现。

例如,下面的代码是合法的:

int i=5, j=6;
int* const array[] = {&i,&j};

而如下代码是非法的:

int i = 5, j = 6;
int& array[] = {i,j};

也就是说,数组元素允许是指针常量,却不允许是引用。C++语言机制如此规定,原因是避免C++语法变得过于晦涩。假如定义一个“引用的数组”,那么array[0]=8;这条语句该如何理解?是将数组元素array[0]本身的值变成8呢,还是将array[0]所引用的对象的值变成8呢?对于程序员来说,这种解释上的二义性对正确编程是一种严重的威胁,毕竟程序员在编写程序的时候,不可能每次使用数组时都要回过头去检查数组的原始定义。

补充:引用与数组之间的关系
  • 引用可以作为数组元素的别名

  • int a[3] = { 1, 2, 3 };
    int& b = a[0];
    b = 4;
    cout << a[0] << endl;
    
  • 引用只有在分配内存的时候才必须初始化

  • struct Test {
    	int& a;
    }
    cout << sizeof(Test) << endl; // 8
    Test test;
    cout << sizeof(test) << endl; // 报错
    
  • 不能建立引用数组

  • int a[3] = {1, 2, 3};
    int &b = a;
    

你可能感兴趣的:(C++知识,c++,java,jvm)