肆（数组与指针②）

肆

数组与指针（二）

数组与指针的纠葛

以指针的形式访问数组：

下标表达式：后缀表达式[表达式]

在C语言中，根据定义，*表达式e1[e2]准确地对应于表达式（（e1）+（e2））。**因此，要求表达式e1[e2]的其中一个操作数是指针，另一个操作数是整数。且这两个操作数的顺序可以颠倒。

故： a[4] 等同于 4[a] 等同于 *(a+4)

编译器把所有的e1[e2]表达式转换成*（（e1）+（e2））。

所以，以下标的形式访问在本质上与以指针的形式访问没有区别，只是写法上不同罢了！

多维数组

二维数组a[i][j]

编译器总是将二维数组看成是一个一维数组，而一维数组的每个元素又都是一个数组。

多维数组定义的下标从前到后可以看做是最宏观的维到最微观的维。例：三维数组a[i][j][k] 可理解为共有i个大组，每个大组里有j个小组，每个小组里有k个元素。

故：

a 表示为整个三维数组，其值为&a[0][0][0]，

&a+1为整个三维数组后面的第一个位置。（偏移整个三维数组的长度）

a+1 为第二个大组的首位置处（偏移一个大组的长度）【数组名a代表的是数组首元素的首地址，即：第一个大组的首地址】

a[0]表示为三维数组的i个大组中的第一个大组【可看做一个二维数组】，其值为&a[0][0][0]，

&a[0]+1为第二个大组的首位置处（偏移一个大组的长度）

a[0]+1为第一个大组中第二个小组的首位置处（a[0]可看做是一个二维数组名，故其代表的是第一个小组的首地址）（偏移一个小组的长度）

a[0][0]表示为第一个大组中的第一个小组【可看做一个一维数组】其值为&a[0][0][0]，

&a[0][0]+1为第一个大组中第二个小组的首位置处（偏移一个小组的长度）

a[0][0]+1为第一个大组中第一个小组的第二个元素位置处（偏移一个元素的长度）

a[0][0][0]表示为第一个大组中的第一个小组中的第一个元素。其值为&a[0][0][0]，a[0][0][0]+1为首元素值加1。（因为a[0][0][0]为元素值而不是地址）

数组的数组（即：二维数组名）退化为数组的(常量)指针，而不是指针的指针。

同理，n维数组名退化为n-1维数组的(常量)指针。

【总结：指针代表的是谁的首地址就以谁的长度为偏移单位。】

【规律：与定义比较，缺少几对方括号，就是几维数组的数组名，如上例：a缺少3对方括号，即为3维数组的数组名（代表的是2维数组的地址）；a[0]缺少2对方括号，即为2维数组的数组名（代表的是1维数组的地址）；a[0][0]缺少1对方括号，即为1维数组的数组名（代表的是数组元素的地址）】

【数组名与整数相加，首先要转换成数组的首元素地址与整数相加，而首元素的存储大小就是整数的单位】

对多维数组的解析：

我们可以用上面那种从前到后的解析方式来思考，a：就表示整个多维数组。a[m]：就表示第m+1大组(大组即数组最大的维)，a[m][n]：就表示第m+1大组中的第n+1小组。(小组即次大的维)，以此类推，即多维数组的解析是层层细化的。

◎☆指针数组与数组指针：

指针数组：首先它是一个数组。数组的元素都是指针。它是“存储指针的数组”的简称。

数组指针：首先它是一个指针。它指向一个数组。它是“指向数组的指针”的简称。

例：int p1[10]; //它是指针数组。（因为[]的优先级比高，p1先与[]结合，构成一个数组的定义）

int (p2)[10] ; //它是数组指针。（括号的优先级较高，与p2构成一个指针的定义）

它指向一个包含10个int型数据的数组。

若有：int(*p)[10][5] ; //则p指向一个int型的二维数组a[10][5]。

【规律：数组指针，把定义中括号内的指针看成是一个普通的字母，则其表示的就是数组指针所指的对象类型】

◎☆

int a[5][5] ; 
int (*p)[4] ; 
p=a ; 

问：&p[4][2]-&a[4][2]的值为多少？

设二维数组的首地址为0，则a[4][2]为第5组的第3个位置(以后见到多维数组要这么想，不要总想着是几排几列的模式)，因为int a[5][5];即有5组，每组有5个元素。故：&a[4][2]是(45+2)sizeof(int).

int (p)[4] ; 指针指向一个含4个int型的元素的数组，故p[4]相对于p[0]向后移动了“4个int型数组”的长度，然后在此基础上再向后移动2个int型的长度（即，其步长按维度逐步递减，多维数组也可按此方式理解）。最后其值为(44+2)* sizeof(int)

最后切记：地址值参与的加减运算（地址不能被乘），整数的单位是地址值代表的元素的存储大小！

&p[4][2]-&a[4][2]结果为-4。若分开比较&p[4][2]和&a[4][2]则相差4 sizeof(int)个字节*

【◎☆规律：数组指针的连续解引用

数组指针的定义提供了其逐次解引用时的偏移单位，例int (p)[m][n][k]，则意为：数组指针的第一次解引用的偏移单位是mnk个int型长度，再次解引用的偏移单位是nk个int型长度，又一次解引用的偏移单位是k个int型长度，最后一次解引用的偏移单位是1个int型长度。它只能连续解引用4次。故：p[2][3][4][5]与四维数组首地址相距(2mnk + 3nk + 4k + 5 )个int型长度】

故：数组指针指向的是哪个数组，就可以把它当做那个数组的数组名来用。

例：inta[3][10][5] ; int (*p)[10][5] ; p = a ; 则：p[1][2][3] == a[1][2][3] ; p[1][2] ==a[1][2]

即：用数组指针访问数组和用数组名访问，效果是相同的。

WHY?以int(*p)[10][5]为例，它指向一个[10][5]的二维数组，故第一次解引用时以二维数组[10][5]的长度作为偏移单位，一次解引用后p[1]就是一个[10][5]二维数组了。(解引用就是提取出指针偏移后指向的对象) 即为：一维数组[5]的首地址。故再次解引用就以一维数组[5]的长度作为偏移单位，二次解引用后p[1][2]就是一个[5]一维数组了，即是一维数组首元素的地址。所以三次引用后，偏移单位为1个元素。

数组参数与指针参数：

1，二维数组名做实参

int  main(void)
{     int  a[4][5] ;
       ……….
       ………
       fun(a);
       ……….
}
被调函数：
①fun( inta[4][5] )
②fun( inta[ ][5] )
③fun( int(*a)[5] )
{   ……….
    a[i][j]=……….
    ………
}

以上三种方式皆可。无论是那种方式，它们只是写法不同，但编译器的处理方式相同，都把它们看做是一维数组指针。

因为二维数组名退化为一个一维数组指针，故是以一维数组指针的形式来传递二维数组的。

2，指针数组做实参

int main(void)
{     int  a[4][5] , i, *p[4] ;
       for(i=0;i<4; i++)
            p[i]= a[i] ;
       ……….
       fun(p);
       ……….
}
被调函数：
①fun(int*q[4])
②fun(int *q[])
③fun(int **q)
{   ……….
    q[i][j]=……….//取出指针数组中的第i个元素(为指针)，再偏移j个单位
//也可从双重指针的角度理解：[i]为第一次解引用，偏移量是i个指针的大小（因为双重指针指向的是指针变量），[j]为第二次解引用，偏移量是j个int型变量大小（因为此时指针指向的是一个int型变量：某组的首元素）
    ………
}

以上三种方式皆可。无论是那种方式，写法不同，但编译器的处理方式相同，都把它们看做是二级指针。

因为指针数组名退化为数组首元素的地址，即二级指针，故是以二级指针的形式来传递指针数组的。

而多维数组名退化为次维数组的指针，即数组指针，故是以数组指针的形式来传递多维数组的。

【数组指针的连续解引用，其指针的步长对应数组的维度值是逐渐减小的

多级指针的连续解引用，其指针的步长前几次解引用的步长为1个指针的长度，最后一次解引用的步长为最终指向的对象长度。（操作系统常用多级指针在多张表中做查询操作）】

【C中函数实参与形参之间是传值引用的，所以你要改变这个值，就传递它的地址（无需多言）】

函数指针：

函数指针就是函数的指针。它是一个指针，指向一个函数。

（即函数在内存中的起始位置地址）

实际上，所有的函数名在表达式和初始化中，总是隐式地退化为指针。

例：int r , (*fp)( ) , func( ) ;

fp= func ; //函数名退化为指针

r= (*fp)( ) ; //等价于r=fp( ) ;

无论fp是函数名还是函数指针，都能正确工作。因为函数总是通过指针进行调用的！

例：int f(int) ; //函数声明

int (*fp)(int) = &f ;//此取地址符是可选的。编译器就把函数名当做函数的入口地址。

//在引用这个函数地址之前，f函数应先声明。

int ans ;

//以下三种方式可调用函数

ans= f(25) ; //函数名后的括号是“函数调用操作符”。

ans= (*fp)(25) ;

ans= fp(25) ;

函数名就是一个函数指针常量，函数调用操作符（即一对括号）相当于解引用

函数的执行过程：

函数名首先被转换为一个函数指针常量，该指针指定函数在内存中的位置。然后函数调用操作符调用该函数，执行开始于这个地址的代码。

再说强制类型转换：

void fun() { printf("Call fun "); }
int main(void)
{
       void(*p)( ) ;
       *(int*)&p = (int)fun ;
       (*p)() ;
       return0 ;
}

参见前面文章的强制类型转换。强制类型转换只不过是改变了编译器对位的解释方法罢了。

(int )&p = (int)fun ;中的fun是一个函数地址，被强制转换为int数字。左边的(int)&p是把函数指针p转换为int型指针。(int )&p = (int)fun ;表示将函数的入口地址赋值给指针变量p。(p)( ) ;表示对函数的调用。

函数指针数组：

即是存储函数指针的数组。（有时非常有用）

例：char (pf[3])(char *) ;

函数指针的用途：

1，转移表（转移表就是一个函数指针数组）

即可用来实现“菜单驱动系统”。系统提示用户从菜单中选择一个选项，每个选项由不同的函数提供服务。

【若每个选项包含许多操作，用switch操作，会使程序变得很长，可读性差。这时可用转移表的方式】

例：void(*f[3])(int) = {function1, function2, function3} ; //定义一个转移表

（*f[choice]）( ) ; //根据用户的选择来调用相应的函数

2，回调函数（用函数指针做形参，用户根据自己的环境写个简单的函数模块，传给回调函数，这样回调函数就能在不同的环境下运行了，提高了模块的复用性）

【回调函数实现与环境无关的核心操作，而把与环境有关的简单操作留给用户完成，在实际运行时回调函数通过函数指针调用用户的函数，这样其就能适应多种用户需求】

例：C库函数中的快速排序函数

voidqsort(void base, int nelem, size_t width, int (fcmp)(void, void) );

//base为待排序的数组基址，nelem为数组中元素个数，width为元素的大小，fcmp为函数指针。

这样，由用户实现fcmp的比较功能（用户可根据需要，写整型值的比较、浮点值的比较，字符串的比较等）这样qsort函数就能适应各种不同的类型值的排序。

使用函数指针的好处在于：

可以将实现同一功能的多个模块统一起来标识，这样一来更容易后期维护，系统结构更加清晰。或者归纳为：便于分层设计、利于系统抽象、降低耦合度以及使接口与实现分开。

函数指针数组的指针：（基本用不到）

例：char ((pf)[3])(char )

这个指针指向一个数组，这个数组里存储的都是指向函数的指针。它们指向的是一种返回值为字符指针，参数为字符指针的函数。

[对于这种复杂的声明，《C和指针》《C专家编程》中有专门的论述。我的方法就是：从核心到外层，层层分析。先找到这个声明的核心，看他的本质是什么。就像本例，最内层的括号里是一个指针，再看外层来确定它是个什么指针。外层是一个3个元素的数组，再看这个数组的元素类型是什么。是一个函数指针。故总体来说此声明是一个函数指针数组的指针。]

复杂指针的举例：

int (a[5])(int, char*);

void (b[10]) (void ()());

doube()() (pa)[9];

让我们一层一层剥开它的心。

第1个、首先找到核心，即标识符a，[ ] 优先级大于“”，a与“[5]”先结合。所以a是一个数组，这个数组有5个元素，每一个元素都是一个指针。再往外层看：指针指向“(int,char)”，对，指向一个函数，函数参数是“int, char”，返回值是“int”。完毕！

第2个、首先找到核心：b是一个数组，这个数组有10个元素，每一个元素都是一个指针，指针指向一个函数，函数参数是“void(*)()”【这个参数又是一个指针，指向一个函数，函数参数为空，返回值是“void”】返回值是“void”。完毕！

第3个、核心pa是一个指针，指针指向一个数组，这个数组有9个元素。再往外层看：每一个元素都是“doube(*)()”【也即一个指针，指向一个函数，函数参数为空，返回值是“double”】

使用typedef简化声明：

某大牛对typedef用法做过一个总结：“建立一个类型别名的方法很简单，在传统的变量声明表达式里用类型名替代变量名，然后把关键字typedef加在该语句的开头”。

举例：

例1，void (b[10]) (void ()());
typedef void (pfv)();                       //先把上式的后半部分用typedef换掉
typedef void (pf_taking_pfv)(pfv);     //再把前半部分用typedef换掉
pf_taking_pfv b[10];                          //整个用typedef换掉

跟void (b[10]) (void ()());的效果一样！
例2，doube()() (pa)[9];
typedef double(PF)();         //先替换前半部分
typedef PF (PA)[9];            //再替换后半部分
PA pa;         //跟doube()() (pa)[9];的效果一样！

反思：

1，我们为什么需要指针？

因为我们要访问一个对象，我们要改变一个对象。要访问一个对象，必须先知道它在哪，也就是它在内存中的地址。地址就是指针值。

所以我们有

函数指针：某块函数代码的起始位置（地址）

指针的指针：因为我要访问（或改变）某个变量，只是这个变量是指针罢了

2，为什么要有指针类型？

因为我们访问的对象一般占据多个字节，而代表它们的地址值只是其中最低字节的地址，我们要完整的访问对象，必须知道它们总共占据了多少字节。而指针类型即向我们提供这样的信息。

注意：一个指针变量向我们提供了三种信息:

①一个首字节的地址值

②这个指针的作用范围（步长）

③对这个范围中的数位的解释规则（解码规则）

【编译器就像一个以步数测量距离的盲人。故你要告诉它从哪开始走，走多少步。】

3，强制类型转换的真相?

学过汇编的人都知道，什么尼玛指针，什么char，int，double，什么数组指针，函数指针，指针的指针，在内存中都尼玛是一串二进制数罢了。只是我们赋予了这些二进制数不同的含义，给它们设定一些不同的解释规则，让它们代表不同的事物。（比如1000 0000 0000 0001 是内存中某4个字节中的内容，如果我们认为它是int型，则按int型的规则解释它为-231+ 1；如果我们认为它是unsigned int ，则被解释为231+ 1；当然我们也可把它解释为一个地址值,数组的地址，函数的地址，指针的地址等）

如果我们使用汇编编程，我们必须根据上下文需要，用大脑记住这个值当前的代表含义，当程序中有很多这样的值时，我们必须分别记清它们当前代表的含义。这样极易导致误用，所以编译器出现了，让它来帮我们记住这些值当前表示的含义。当我们想让某个值换一种解释的方案时，就用强制类型转换的方式来告诉编译器，编译器则修改解释它的规则，而内存中的二进制数位是不变的（涉及浮点型的强制转换除外，它们是舍掉一些位，保留一些位）

4，涉及浮点型的强制转

详情参见《深入理解计算机系统》

5，难点

多维数组、数组指针、多级指针。

抓住问题的核心：指针值是谁的地址，这个地址代表的是哪个对象。

搞清楚这个问题，关于指针移动时偏移量（步长）的计算就不会出错。

指针类型只是C语言提供的一种抽象，来帮助程序员避免寻址错误。