地址长度的字符串文字

我看到在使用GCC的Linux系统上,字符串文字的地址似乎比其他变量小得多。 例如,以下代码生成下面显示的o / p。

#include  int main() { char *str1 = "Mesg 1"; char *str2 = "Mesg 2"; char str3[] = "Mesg 3"; char str4[] = "Mesg 4"; printf("str1 = %p\n", (void *) str1); printf("str2 = %p\n", (void *) str2); printf("&str3 = %p\n", (void *) str3); printf("&str4 = %p\n", (void *) str4); return 0; } 

输出:

 str1 = 0x400668 str2 = 0x40066f &str3 = 0x7fffcc990b10 &str4 = 0x7fffcc990b00 

这种用法是否有一个独立的地址空间?

该标准没有指定字符串文字将驻留在何处,但很可能它将在只读数据部分中。 例如,在使用objdump的Unix系统上,您可以像这样检查只读数据部分:

 objdump -s -j .rodata a.out 

并使用实例我们可以看到类似于此的输出:

 Contents of section .rodata: 400758 01000200 4d657367 20310073 74723120 ....Mesg 1.str1 400768 3d202570 0a004d65 73672032 00737472 = %p..Mesg 2.str 400778 32203d20 25700a00 26737472 33203d20 2 = %p..&str3 = 400788 25700a00 26737472 34203d20 25700a00 %p..&str4 = %p.. 

C99标准草案第6.4.5字符串文字第5段说:

[…]多字节字符序列然后用于初始化静态存储持续时间和长度的数组,足以包含序列。[…]

这意味着字符串文字的生命周期是程序的生命周期, 第6段说:

如果这些数组的元素具有适当的值,则这些数组是否不同是未指定的。 如果程序试图修改此类数组,则行为未定义。

所以我们不知道它们是否是不同的,这将是一个实现选择,但我们知道我们无法修改它们。 否则,它没有指定它们应该如何存储。

 char *str1 = "Mesg 1"; char *str2 = "Mesg 2"; char str3[] = "Mesg 3"; char str4[] = "Mesg 4"; 

str1str2是指针对象,指向字符串文字 – 或者更确切地说,指向与这些字符串文字相关联的匿名静态数组对象。 这些数组具有静态存储持续时间 ,这意味着它们存在于整个程序执行中。 它们也是只读的,这可能会影响实现选择存储它们的位置。 (顺便说一句,因为字符串文字是只读的,所以指向它们的指针应该声明为const 。)

str3str4不是指针; 它们是使用指定值初始化的数组对象。 它们具有自动存储持续时间 ,这意味着它们仅在执行最近的封闭块期间存在(在这种情况下,在执行main函数时)。 对于main ,除非你使用递归调用或atexit处理程序进行技巧,否则没有多少实际区别,但对于其他函数来说,这很重要。 具有自动存储持续时间的对象通常在堆栈上分配,并在函数返回时释放。

(在大多数情况下,数组表达式被隐式转换为指向数组第一个元素的指针。有关详细信息,请参阅comp.lang.c FAQ的第6节。)

在您的系统上,显然只读静态对象分配在0x400000左右的低地址,而堆栈位于低于0x800000000000 (2 47 )的更高地址。 这可能因系统而异。

重要的是要注意所有这些地址具有相同的长度。 您好像使用的是64位系统。 0x400668不是32位地址; 它是一个64位的地址恰好有一个小的数值。 printf用于%p的输出格式是实现定义的; 它可以打印:

 str1 = 0x0000000000400668 str2 = 0x000000000040066f &str3 = 0x00007fffcc990b10 &str4 = 0x00007fffcc990b00 

这种用法是否有一个独立的地址空间?

不,这完全取决于实现。 只有确定的事情是:

  • 字符串文字在程序的整个生命周期内都保持活动状态
  • 如果您仍然修改字符串文字,则会得到未定义的行为。

一些实现将字符串文字放在只读数据段中,这可能与常规数据有明显不同的地址。 但这取决于实施方式,所以不要认为它是通用的。