返回课程
编程 > C 教程专题 > 第一部分:C 基础教程 > 8.从零开始之何谓类

  前篇说明了结构只不过是定义了内存布局而已,提到类型定义符前还可以书写class,即类型的自定义类型(简称类),它和结构根本没有区别(仅有一点小小的区别,下篇说明),而之所以还要提供一个class,实际是由于C++是从C扩展而成,其中的class是C++自

  己提出的一个很重要的概念,只是为了与C语言兼容而保留了struct这个关键字。不过通过前面括号中所说的小小区别也足以看出C++的设计者为结构和类定义的不同语义,下篇说明。

  暂时可以先认为类较结构的长足进步就是多了成员函数这个概念(虽然结构也可以有成员函数),在了解成员函数之前,先来看一种语义需求。

  操作与资源

  程序主要是由操作和被操作的资源组成,操作的执行者就是CPU,这很正常,但有时候的确存在一些需要,需要表现是某个资源操作了另一个资源(暂时称作操作者),比如游戏中,经常出现的就是要映射怪物攻击了玩家。之所以需要操作者,一般是因为这个操作也需要修改操作者或利用操作者记录的一些信息来完成操作,比如怪物的攻击力来决定玩家被攻击后的状态。这种语义就表现为操作者具有某些功能。为了实现上面的语义,如原来所说进行映射,先映射怪物和玩家分别为结构,如下:

  struct Monster { float Life; float Attack; float Defend; };

  struct Player { float Life; float Attack; float Defend; };

  上面的攻击操作就可以映射为void MonsterAttackPlayer( Monster &mon, Player &pla );。注意这里期望通过函数名来表现操作者,但和前篇说的将过河方案起名为sln一样,属于一种本末倒置,因为这个语义应该由类型来表现,而不是函数名。为此,C++提供了成员函数的概念。

  成员函数

  与之前一样,在类型定义符中书写函数的声明语句将定义出成员函数,如下:

  struct ABC { long a; void AB( long ); };

  上面就定义了一个映射元素--第一个变量ABC::a,类型为long ABC::;以及声明了一个映射元素--第二个函数ABC::AB,类型为void ( ABC:: )( long )。类型修饰符ABC::在此修饰了函数ABC::AB,表示其为函数类型的偏移类型,即是一相对值。但由于是函数,意义和变量不同,即其依旧映射的是内存中的地址(代码的地址),但由于是偏移类型,也就是相对的,即是不完整的,因此不能对它应用函数操作符,如:ABC::AB( 10 );。这里将错误,因为ABC::AB是相对的,其相对的东西不是如成员变量那样是个内存地址,而是一个结构指针类型的参数,参数名一定为this,这是强行定义的,后面说明。

  注意由于其名字为ABC::AB,而上面仅仅是对其进行了声明,要定义它,仍和之前的函数定义一样,如下:

  void ABC::AB( long d ) { this->a = d; }

  应注意上面函数的名字为ABC::AB,但和前篇说的成员变量一样,不能直接书写long ABC::a;,也就不能直接如上书写函数的定义语句(至少函数名为ABC::AB就不符合标识符规则),而必须要通过类型定义符“{}”先定义自定义类型,然后再书写,这会在后面说明声明时详细阐述。

  注意上面使用了this这个关键字,其类型为ABC*,由编译器自动生成,即上面的函数定义实际等同于void ABC::AB( ABC *this, long d ) { this->a = d; }。而之所以要省略this参数的声明而由编译器来代劳是为了在代码上体现出前面提到的语义(即成员的意义),这也是为什么称ABC::AB是函数类型的偏移类型,它是相对于这个this参数而言的,如何相对。

  

  如下:

  ABC a, b, c; a.ABC::AB( 10 ); b.ABC::AB( 12 ); c.AB( 14 );

  上面利用成员操作符调用ABC::AB,注意执行后,a.a、b.a和c.a的值分别为10、12和14,即三次调用ABC::AB,但通过成员操作符而导致三次的this参数的值并不相同,并进而得以修改三个ABC变量的成员变量a。注意上面书写a.ABC::AB( 10 );,和成员变量一样,由于左右类型必须对应,因此也可a.AB( 10 );。还应注意上面在定义ABC::AB时,在函数体内书写this->a = d;,同上,由于类型必须对应的关系,即this必须是相应自定义类型的指针,所以也可省略this->的书写,进而有void ABC::AB( long d ) { a = d; }。

  注意这里成员操作符的作用,其不再如成员变量时返回相应成员变量类型的数字,而是返回一函数类型的数字,但不同的就是这个函数类型是无法用语法表示出来的,即C++并没有提供任何关键字或类型修饰符来表现这个返回的类型(VC内部提供了__thiscall这个类型修饰符进行表示,不过写代码时依旧不能使用,只是编译器内部使用)。也就是说,当成员操作符右侧接的是函数类型的偏移类型的数字时,返回一个函数类型的数字(表示其可被施以函数操作符),函数的类型为偏移类型中给出的类型,但这个类型无法表现。即a.AB将返回一个数字,这个数字是函数类型,在VC内部其类型为void ( __thiscall ABC:: )( long ),但这个类型在C++中是非法的。

  C++并没有提供类似__thiscall这样的关键字以修饰类型,因为这个类型是要求编译器遇到函数操作符和成员操作符时,如a.AB( 10 );,要将成员操作符左侧的地址作为函数调用的第一个参数传进去,然后再传函数操作符中给出的其余各参数。即这个类型是针对同时出现函数操作符和成员操作符这一特定情况,给编译器提供一些信息以生成正确的代码,而不用于修饰数字(修饰数字就要求能应付所有情况)。即类型是用于修饰数字的,而这个类型不能修饰数字,因此C++并未提供类似__thiscall的关键字。和之前一样,由于ABC::AB映射的是一个地址,而不是一个偏移值,因此可以ABC::AB;但不能ABC::a;,因为后者是偏移值。根据类型匹配,很容易就知道也可有:

  void ( ABC::*p )( long ) = ABC::AB;或void ( ABC::*p )( long ) = &ABC::AB;

  进而就有:void ( ABC::**pP )( long ) = &p; ( c.**pP )( 10.0f );。之所以加括号是因为函数操作符的优先级较“*”高。再回想前篇说过指针类型的转换只是类型变化,数值不变(下篇说明数值变化的情况),因此可以有如下代码,这段代码毫无意义,在此仅为加深对成员函数的理解。

  struct ABC { long a; void AB( long ); };

  void ABC::AB( long d )

  {

  this->a = d;

  }

  struct AB

  {

  short a, b;

  void ABCD( short tem1, short tem2 );

  void ABC( long tem );

  };

  void AB::ABCD( short tem1, short tem2 )

  {

  a = tem1; b = tem2;

  }

  void AB::ABC( long tem )

  {

  a = short( tem / 10 );

  b = short( tem - tem / 10 );

  }

  void main()

  {

  ABC a, b, c; AB d;

  ( c.*( void ( ABC::* )( long ) )&AB::ABC )( 43 );

  ( b.*( void ( ABC::* )( long ) )&AB::ABCD )( 0XABCDEF12 );

  ( d.*( void ( AB::* )( short, short ) )ABC::AB )( 0XABCD, 0XEF12 );

  }

  

  上面执行后,c.a为0X00270004,b.a为0X0000EF12,d.a为0XABCD,d.b为0XFFFF。对于c的函数调用,由于AB::ABC映射的地址被直接转换类型进而直接被使用,因此程序将跳到AB::ABC处的a = short( tem / 10 );开始执行,而参数tem映射的是传递参数的内存的首地址,并进而用long类型解释而得到tem为43,然后执行。注意b = short( tem - tem / 10 );实际是this->b = short( tem - tem / 10 );,而this的值为c对应的地址,但在这里被认为是AB*类型(因为在函数AB::ABC的函数体内),所以才能this->b正常(ABC结构中没有b这个成员变量),而b的偏移为2,所以上句执行完后将结果39存放到c的地址加2所对应的内存,并且以short类型解释而得到的16位的二进制数存放。对于a = short( tem / 10 );也做同样事情,故最后得c.a的值为0X0027004(十进制39转成十六进制为0X27)。

  同样,对于b的调用,程序将跳到AB::ABCD,但生成的b的调用代码时,将参数0XABCDEF12按照参数类型为long的格式记录在传递参数的内存中,然后跳到AB::ABCD。但编译AB::ABCD时又按照参数为两个short类型来映射参数tem1和tem2对应的地址,因此容易想到tem1的值将为0XEF12,tem2的值为0XABCD,但实际并非如此。参数如何传递由之前说的函数调用规则决定,函数调用的具体实现细节在《C++从零开始(十五)》中说明,这里只需了解到成员函数映射的仍然是地址,而它的类型决定了如何使用它,后面说明。

  声明的含义前面已经解释过声明是什么意思,在此由于成员函数的定义规则这种新的定义语法,必须重新考虑声明的意思。注意一点,前面将一个函数的定义放到main函数定义的前面就可以不用再声明那个函数了;同样如果定义了某个变量,就不用再声明那个变量了。这也就是说定义语句具有声明的功能,但上面成员函数的定义语句却不具有声明的功能,下面来了解声明的真正意思。

  声明是要求编译器产生映射元素的语句。所谓的映射元素,就是前面介绍过的变量及函数,都只有3栏(或3个字段):类型栏、名字栏和地址栏(成员变量类型的这一栏就放偏移值)。即编译器每当看到声明语句,就生成一个映射元素,并且将对应的地址栏空着,然后留下一些信息以告诉连接器--此.obj文件(编译器编译源文件后生成的文件,对于VC是.obj文件)需要一些符号,将这些符号找到后再修改并完善此.obj文件,最后连接。

  回想之前说过的符号的意思,它就是一字符串,用于编译器和连接器之间的通信。注意符号没有类型,因为连接器只是负责查找符号并完善(因为有些映射元素的地址栏还是空的)中间文件(对于VC就是.obj文件),不进行语法分析,也就没有什么类型。

  定义是要求编译器填充前面声明没有书写的地址栏。也就是说某变量对应的地址,只有在其定义时才知道。因此实际的在栈上分配内存等工作都是由变量的定义完成的,所以才有声明的变量并不分配内存。但应注意一个重点,定义是生成映射元素需要的地址,因此定义也就说明了它生成的是哪个映射元素的地址,而如果此时编译器的映射表(即之前说的编译器内部用于记录映射元素的变量表、函数表等)中没有那个映射元素,即还没有相应元素的声明出现过,那么编译器将报错。

  但前面只写一个变量或函数定义语句,它照样正常并没有报错啊?实际很简单,只需要将声明和定义看成是一种语句,只不过是向编译器提供的信息不同罢了。如:void ABC( float );和void ABC( float ){},编译器对它们相同看待。前者给出了函数的类型及类型名,因此编译器就只填写映射元素中的名字和类型两栏。由于其后只接了个“;”,没有给出此函数映射的代码,因此编译器无法填写地址栏。而后者,给出了函数名、所属类型以及映射的代码(空的复合语句),因此编译器得到了所有要填写的信息进而将三栏的信息都填上了,结果就表现出定义语句完成了声明的功能。

  对于变量,如long a;。同上,这里给出了类型和名字,因此编译器填写了类型和名字两栏。但变量对应的是栈上的某块内存的首地址,这个首地址无法从代码上表现出来(前面函数就通过在函数声明的后面写复合语句来表现相应函数对应的代码所在的地址),而必须由编译器内部通过计算获得,因此才硬性规定上面那样的书写算作变量的定义,而要变量的声明就需要在前面加extern。即上面那样将导致编译器进行内部计算进而得出相应的地址而填写了映射元素的所有信息。

  


  • 扫一扫 扫二维码继续学习