为什么C字符串文字的最大长度与max char 不同?
澄清 :鉴于字符串文字可以重写为const char[]
(见下文),在文字上施加比char[]
更低的最大长度只是语法上的不便。 为什么C标准鼓励这个?
C89标准对字符串文字有翻译限制:
字符串文字或宽字符串文字中的509个字符(连接后)
char数组没有限制; 也许
对象中的32767个字节(仅限托管环境中)
适用(我不确定什么对象或托管环境的意思),但无论如何它是一个更高的限制。
我的理解是字符串文字等同于包含字符的char数组,即:它总是可以重写这样的东西:
const char* str = "foo";
进入这个
static const char __THE_LITERAL[] = { 'f', 'o', 'o', '\0' }; const char* str = __THE_LITERAL;
那么为什么文字如此严格限制呢?
字符串文字的限制是编译时要求; 对逻辑源行的长度有类似的限制。 编译器可能使用固定大小的数据结构来保存源行和字符串文字。
(C99将这些特定限制从509个字符增加到4095个字符。)
另一方面,可以在运行时构建对象(例如char
数组)。 限制可能是由目标机器架构强加的,而不是由编译器的设计强加的。
请注意,这些不是对程序施加的上限。 编译器不需要施加任何有限的限制。 如果编译器对行长度施加限制,则它必须至少为509或4095个字符。 (我认为,大多数实际编译器都不会施加固定限制;而是动态分配内存。)
这不是509个字符是字符串的限制,它是ANSI兼容性所需的最小值,如此处所述。
我认为该标准的制造商从他们的屁股中取出了509,但除非我们从中得到一些官方文件,否则我们无法知道。
至于字符串文字中实际可以包含多少个字符,这取决于编译器。
这里有些例子:
- MSVC:2048
- GCC:无限制(最多100,000个字符),但在510个字符后发出警告:
长度为100000的字符串文字超过了C90编译器需要支持的最大长度509
对于迟到的答案感到抱歉,但我想说明这两种情况之间的区别(Richard J. Ross已经指出它们不相同。)
假设你试试这个:
const char __THE_LITERAL[] = { 'f', 'o', 'o', '\0' }; const char* str = __THE_LITERAL; char *str_writable = (char *) str; // Not so const anymore str_writable[0] = 'g';
现在str
包含“goo”。
但是如果你这样做:
const char* str = "foo"; char *str_writable = (char *) str; str_writable[0] = 'g';
结果:段错! (至少在我的平台上。)
这是根本区别:在第一种情况下,您有一个初始化为“foo”的数组,但在第二种情况下,您有一个实际的字符串文字。
在旁注,
const char __THE_LITERAL[] = { 'f', 'o', 'o', '\0' };
完全等同于
const char __THE_LITERAL[] = "foo";
这里=
充当数组初始化器而不是赋值。 这是非常不同的
const char *str = "foo";
其中字符串文字的地址分配给str
。