用C读取Unicode文件
今天晚上闲来无事,便想用C写个读取unicode文件。我平时都是读取ascii文件,一直没什么问题,结果在读取unicode文件时遇到一个小问题,特记下来以做一个留念。
先看刚开始的代码:
FILE* file = _wfopen(L"c:\BOOTEX.LOG", L"r"); if (file == NULL) { perror("open file errror"); system("pause"); return 1; } wchar_t line[SIZE1]; _wmemset(line, " ", SIZE1); while(fgetws(line, SIZE1, file) != NULL) { //line[strlen(line)-1] = " "; wprintf(L"%s ", line); //memset(line, " ", SIZE1); } fclose(file);运行程序,只输出了一个字符: C。
BOOST.LOG原文件的内容为:Checking file system on C:
单步调试,发现读文件一次后,line的内容为:C h e c k i n g f i l e s y s t e m o n C :
,原来每个字符占用了两字节,输出了第一个字符 “C"。接下来读文件,line都是以 " " 开头,什么都没有输出。
思来想去,查了许多资料也没找到原因。后来实在没办法,我就心想用二进制文件来打开文件试试:FILE* file = _wfopen(L"c:\BOOTEX.LOG", L"rb"), 没想到unicode文件输出正常了。为什么二进制文件读写就行呢,我暂时也没有想明白。如果大家知道原因的话,请也告诉我。
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。