柒（文件、输入输出函数）

柒

流

流是什么？形象的比喻——水流，文件和程序之间连接一个管道，水流就在之间形成了,自然也就出现了方向：可以流进，也可以流出。

便于理解，这么定义流：流就是一个管道里面有流水，这个管道连接了文件和程序。

UNIX系统认为一切皆文件，所有的外部设备都被看做文件。

文件

文本文件和二进制文件

实质：在计算机底层只有0和1。

何谓文件？文件就是一些相关信息位的集合。

文本文件只不过是把其文件存储空间按字节分割，即：它以字节为解释信息的单位，每个字节中存储的是一个ASCII码的小整数。

二进制文件则是把文件存储空间当做内存一样，可在其中按数据类型定义并存储数据。

例：把数据123存储到文件中。

若是按文本的方式来存储则会占用3字节，每个字节中的内容是：0x31 0x32 0x33 （即：数字49,50,51）它们对应着ASCII字符’1’ ‘2’ ‘3’

若是按二进制方式来存储则会占用4字节,这4字节即一个int型数据123

信息就是：位+上下文

在计算机内部只有位，是我们根据需要赋予了这些位不同的解释规则（即上下文），所以会呈现出不同的结果。

★文本文件就是我们用ASCII码的规则编码，然后再用ASCII码的规则解释，这样信息就可以反映出我们的实际意愿。

★二进制文件就是我们用程序制定的自定义的一套规则编码（程序会设置这些位代表的含义，比如哪些位表示的是一个浮点数，哪些位表示的是一个整数等），最后我们用先前自定义的规则来解释这些位，同样可以得到正确的信息。【实际上是，我们把文件当做内存区一样，按C语言定义的数据类型规则，该占多少位就占多少位，对数据不用转换处理】

所以：文本文件和二进制文件的区别就是它们编码解码的规则不同，文本文件是按ASCII码的规则来编码解码的，而二进制文件是按自定义规则来编码解码的。

故，用二进制的方式也可以建造一个文本文件，[只要我们按照ASCII码来编码即可。]

打开和关闭文件

fopen(文件名，文件打开方式)

有以文本模式打开文件，和以二进制模式打开文件。（每种模式又有很多种打开方式）

实质：这两种模式没有任何区别！它们都是向系统申请一段磁盘空间用以存储待写的数据。

而如何存储即如何编码，将会导致它们是成为文本文件还是二进制文件。

不要根据文件的后缀名来判断一个文件的类型，后缀名只是方便应用程序识别文件。.txt文件也可以以二进制的形式编码，我们也可以把用ASCII编码的数据写入exe文件中。

后缀名只是文件名的一部分罢了。

fclose(文件指针) ; 关闭文件指针所指向的文件。

fcloseall( ) ; 关闭所有已打开的文件。

为什么要关闭文件：

1、操作系统允许打开的文件数是有限制的。若某程序忘记关闭文件，若其被多个程序调用，则可能导致文件数资源耗尽，其它程序无法打开文件。

2、若文件操作方式为“写”方式，则系统首先把该文件缓冲区(在内存中)中的剩余数据全部输出到文件中，然后使文件指针fp与文件断开联系。

若对文件操作后不关闭文件，则可能导致文件中数据的丢失。

【无论是动态分配内存还是文件操作，使用完资源后要马上释放资源！】

C语言系统定义了三个默认的文件指针：[它们都是文本文件,此即为一切皆文件的思想]

1、stdin 即标准输入文件，与键盘连接。（即把键盘当做文件）

2、stdout 即标准输出文件，与屏幕连接。（即把屏幕当做文件）

3、stderr 即标准出错文件，与屏幕连接。

（它们都是常量指针，故不能被重定向）

注意：

stdout和stderr是不是同设备描述符。stdout是块设备，stderr则不是。对于块设备，只有当下面几种情况下才会被输入，1）遇到回车，2）缓冲区满，3）flush被调用。而stderr则不会。

例：fprintf(stdout,"hello-std-out");//不一定会输出

fprintf(stderr,"hello-std-err");//一定会输出

文本文件的读写操作

①用fgetc()读取一个字符

int fget(FILE * stream) ;

功能：从文件stream中读一个字符，并把它作为函数返回值

②用fputc()写入一个字符

int fputc (int ch, FILE *stream) ;

功能：把字符ch写入到文件stream中。

③用fgets()从文件中读取字符串

char fgets (char string, int n, FILE *stream) ;

功能：从文件stream中读取n-1个字符放入以string为首地址的空间里。读入结束后，系统将自动在最后加’’，并以string作为函数值返回。

④用fputs()把一个字符串写入到文件中

int fputs (char string, FILE stream) ;

功能：把字符串string写入到文件stream中

文本格式化的输入输出

⑤用fscanf函数，从文本文件中按格式读取数据

fscanf(FILE *stream, 格式控制字符串, 参数列表) ;

[与从键盘输入的形式格式规则一样]

⑥用fprintf函数，按格式向文本文件写入字符数据

fprintf(FILE *stream, 格式控制字符串, 参数列表) ;

[与输出到屏幕的形式格式规则一样]

二进制文件的读写操作

①int fread (void ptr, int size, int nitems, FILE stream);

从文件stream中读取nitems个size大小的数据放到ptr指向的缓冲区中。

②int fwrite (void ptr, int size, int nitems, FILE stream);

从ptr指向的缓冲区中取出nitems个size大小的数据写到文件stream中

【这种类型的I/O效率很高，因为每个值中的位直接从流中读取或写入，不需要任何转换】

【实际上，二进制I/O函数也可以用来建立文本文件，只是在格式化I/O时，操作不太方便。

文本I/O函数也可以用来建立二进制文件，（要清楚数据的实际位表示情况），操作很不方便】

因为，在底层任何类型的文件都是用0和1表示的，只是文本I/O函数按照ASCII码的规则编码解码，但我们同样可以用二进制I/O函数根据ASCII码的规则编码解码也能做成文本文件，只是略显复杂。

所以，虽然这些函数可以完成其它的工作，但是让它们做适合它们的工作，我们操作起来会更方便，更顺手。

【把数据写到文件中，效率最高的方法是用二进制的形式写入。二进制的输出避免了在数值转换为字符过程中所涉及的开销和精度损失。但二进制文件非人眼所能阅读，我们必须记住它的存储格式才能读取其中的数据。】

【注意：文件是流！故当读或写时，文件指针随着读写的流向而移动，它不是一直指向文件头部的！】

文件指针的流动，是系统完成的，它有一些隐藏的复杂机制，不是像一般指针那样通过加减整数来实现的。fp++;的意思是指针移动一个文件的长度（因为它指向的对象是一个文件）

【文件是流，字符串不是流。】

文件指针定位

因为文件指针比较特殊，我们无法通过取地址，增量操作来移动指针，故要改变指针的位置，需要利用专门的库函数。

这些函数一般用于二进制流文件，因为二进制流文件是值的真实反映，可精确定位到某位置，而文本流用以下函数定位指针，可能会出现偏差。

①int fseek (FILE *stream, long offset, int fromwhere) ;

把文件指针定位到，相对于fromwhere处距离offset字节的位置处

fromwhere 取值0 代表文件的开始位置；取值1 代表当前文件指针的位置；取值2代表文件尾部位置。

②long ftell (FILE *stream) ;

返回当前文件指针的位置(据文件头部的位置)

【在二进制流中，这个值准确反映了当前位置距离文件起始位置之间的字节数。但在文本流中，这个值不一定能准确表示当前位置距离文件起始位置之间的字节数。】

③int rewind (FILE *stream) ;

将文件指针重新指向一个流的开头位置

【若在主函数中打开一个流，把流指针传给多个函数调用时，注意：每个被调用函数的开始部分，最好用rewind(FILE *)把指针复位到文件开头[因为多次调用，可能会改变流指针的位置]】

检测流文件上的文件结束符：

int feof (FILE *stream) ;

若遇到文件结束符，函数feof返回1，否则返回0

【注意：在C语言中，只有输入程序试图读取并失败以后才能得到EOF】

故：依靠feof函数来检测文件结束，可能会产生BUG！

while( !feof( infp ) )

{ fgets(buf, MAXLINE, info ) ;

fputs(buf, outfp ) ;

}//因为程序读取文件失败后才能检测到文件结束，故此代码中的语句会多执行一次，产生BUG

【一般情况，完全没有必要使用feof，我们可以通过检查文件I/O函数的返回值来判断文件是否结束】

例：while(fgets( buf, MAXLINE, infp ) != NULL )

…… ;

输入输出函数

【注意：文件是一种流，输入输出的字符也是流。流的性质：你只能顺序地访问并提取流中的数据，未提取的数据只能阻塞在流中，等待下次被访问或提取。】

一、格式化I/O函数

scanf函数

①用scanf(“%s”,……) ; 读入字符串时，

前导空白将被丢弃忽略，当遇到空格回车等分隔符时，读入结束。空格或回车符留在流中，等待下次读入。

②用scanf(“%d”,……)读入数字；scanf(“%c”,……)读入字符时

一次读取一个数据，剩余的字符留在流中，等待下次读入。

停留在流中的字符可能会影响到下次的正确读入，丢弃输入流中字符的方法：

⑴输入结束后，把流中剩余的垃圾字符都读掉。

while( (ch = getchar())!=EOF && ch!= ‘ ’)

NULL ;

⑵用函数fflush(FILE *stream); 清除一个流。

对于输入流为fflush(stdin);

int scanf( char const *format, …… ) ;

int fscanf( FILE stream, char const format, …… ) ;

int sscanf( char const string, char const format, ……) ;

//以上函数的读入处理规则都相同，不同的是它们读取的流不同，一个是从键盘读取、一个从文件流读取、一个从字符串读取。（注意：字符串不是流，其没有流指针保存读取位置）

int printf( char const *format, …… ) ;

int fprintf ( FILE stream, char const format, …… ) ;

int sprintf ( char const string, char const format, ……) ;

//以上函数的输出字符规则都相同，不同的是它们写入的流不同，一个是向屏幕写入、一个向文件流写入、一个向字符串写入。

【注意：sprintf函数是一个潜在的错误根源，它可能会导致缓冲区溢出。(要提前估计好缓冲区的大小)】

【注意：printf返回值是输出的字符个数。】

#include <stdio.h>

int main()

{

   int i=43;

   printf("%d
",printf("%d",printf("%d",i)));

   return 0;

}//程序会输出4321

二、未格式化I/O函数

fgetc( ) 接受一个输入流作为参数，它从这个流中读取一个字符（可读入回车等空白符），如果发生错误或流已到结尾，则返回EOF。

char fgets( char s, int n, FILE *fp ) ;

A、若输入由于遇到换行符而终止，则这个换行符也存储于缓冲数组中（就在’’符之前）

B、若未遇到换行符或文件尾，就读取了n-1个字符。则在缓冲数组末尾添加’’符。

gets( )和fgets( )不同，gets( )会丢弃换行符，并不把它存储在缓冲数组中。

但gets( )对于输入长度没有限制，很可能导致输入长度超过缓冲数组的长度，导致缓冲区溢出。

【故：我们一般用fgets( )函数来接收用户输入。（这样可允许用户输入任意字符）再在程序中分析用户输入，提取数据】