如果你不知道要读取的字符数,如何使用fgets?

我需要读取一个文件并将文本从它发送到一个字符串,以便我可以解析它。 但是,程序不会准确知道文件的长度,所以如果我想使用fgets() ,或者有更好的选择,我该怎么办?

注意:

 char *fgets(char *str, size_t num, FILE *stream); 

不要忘记fgets()读取一行,但要有足够的空间。

人类很少写行超过… 80,256,选择一个数字……字符。 POSIX建议行长度为4096.所以,我通常使用:

 char buffer[4096]; while (fgets(buffer, sizeof(buffer), fp)) { ...process line... } 

如果您担心有人可能在一行中提供超过4K的数据(并且机器生成的文件,例如HTML或JSON,可能包含该数据),那么您必须决定下一步该做什么。 您可以执行以下任何操作(并且可能还有其他一些我未提及的选项):

  1. 以位为单位处理过长的行而不假设其间存在换行符。
  2. 为更长的行分配内存(比如8K开始),将初始4K复制到分配的缓冲区,并将更多数据读入缓冲区的后半部分,迭代直到找到行尾。
  3. 使用Linux上提供的POSIX 2008函数getline() 。 它为你做内存分配。

你可以迭代地使用fgets,但更简单的替代方法是(stdio.h) getline 。 它在POSIX中,但它不是标准C.

既然你正在使用C ++,你可以使用像iostream的getline这样的std :: string函数吗?

如果您不在POSIX系统上并且没有getline可用,请查看Chuck Falconer的公共域ggets / fggets函数 ,这些函数动态增加缓冲区以消耗整行。 (这个链接现在似乎已经关闭,但archive.org有一份副本 。)

分配缓冲区( str指向的缓冲区),并将缓冲区的大小传递给num 。 占用的实际空间仅为fgets读取的文本的长度。

就像是:

 char str[1000]; fgets(str, 1000, &file); 

如果下一行在换行符之前只有10个字符,则str将保存这10个字符,换行符和空终止符。

编辑 :以防万一有任何混淆,我不打算听到上面的声音,好像缓冲区中的额外空间没有被使用。 我只是想说明你不需要提前知道你的字符串将持续多长时间,只要你可以在它上面放一个最大长度。