使用fgetc时，是否可以将EOF与正常的字节值混淆？

我们经常使用这样的fgetc ：

 int c; while ((c = fgetc(file)) != EOF) { // do stuff }

从理论上讲，如果文件中的某个字节的值为EOF ，则此代码存在错误 – 它会提前中断循环并且无法处理整个文件。这种情况可能吗？

据我所知， fgetc内部将从文件读取的字节转换为unsigned char ，然后转换为int ，并返回它。如果int的范围大于unsigned char的范围，这将起作用。

如果不是（可能那么sizeof(int)=1 ）会发生什么？

fgetc有时会从文件中读取等于EOF的合法数据吗？
它会改变从文件中读取的数据以避免单值EOF吗？
fgetc会是一个未实现的function吗？
EOF会不会是另一种类型，比如long ？

我可以通过额外的检查使我的代码变得简单：

 int c; for (;;) { c = fgetc(file); if (feof(file)) break; // do stuff }

如果我想要最大的便携性是必要的吗？

是的， c = fgetc(file); if (feof(file)) c = fgetc(file); if (feof(file))确实可以实现最大的可移植性。它通常起作用，并且当unsigned char和int具有相同数量的唯一值时。这种情况发生在罕见的平台上，包括char ， signed char ， unsigned char ， short ， unsigned short ， int ， unsigned所有这些都使用相同的位宽和范围宽度。

请注意， feof(file))不足。代码还应检查ferror(file) 。

 int c; for (;;) { c = fgetc(file); if (c == EOF) { if (feof(file)) break; if (ferror(file)) break; } // do stuff }

C规范说int必须能够保持-32767到32767的值至少。任何具有较小int平台都是非标准的。

C规范还说EOF是一个负的int常量，并且fgetc在成功读取时返回“转换为int的unsigned char ”。由于unsigned char不能具有负值，因此可以将EOF的值与从流中读取的任何内容区分开来。 ^*

^*请参见下文，了解未能解决的漏洞案例。

使用fgetc时，是否可以将EOF与正常的字节值混淆？

读取每个30字节大二进制文件的最快方法？

用C ++写一个文件的不同结构？

为什么fwrite（）在Mac OS X上使用C中的“wb”写入二进制文件？

如何按指令读取二进制可执行文件？

如何使用fread和fwrite函数来读写二进制文件？

C在二进制文件的中间写入而不覆盖任何现有内容

在C中使用mmap读取二进制文件时的Segfault

存储在二进制文件中的int不成功fread（），分段错误

从二进制文件中读取动态大小的字符串

如何在不使用库的情况下获取jpeg文件的宽度/高度？