我们什么时候需要使用posix_memalign而不是malloc?
似乎posix_memalign
允许您选择自定义alignment
,但何时需要?
malloc
已经在内部完成了对齐工作。
UPDATE
我问这个的确切原因是因为我看到nginx这样做, ngx_memalign(NGX_POOL_ALIGNMENT, size, log);
,这里NGX_POOL_ALIGNMENT
被定义为16
, nginxs.googlecode.com/svn-history/trunk/src/core/ngx_palloc.c
基本上,如果你需要比malloc更强的对齐方式给你。 Malloc通常返回一个对齐的指针,它可以与任何基本类型一起使用(通常,在普通台式机上使用8个字节)。
但是,有时您需要在其他边界上对齐内存,例如4K对齐等。在这种情况下,您需要memalign
。
你需要这个,例如,
- 在编写内存管理器(例如垃圾收集器)时。 在这种情况下,使用在较大块大小上对齐的内存有时很方便。 这样,您可以存储分配区域底部给定块中所有对象共有的元数据,并通过屏蔽对象指针的最低有效位来访问它。
- 当与硬件连接时(我自己从未这样做,但IIRC,某些类型的块设备需要对齐的内存)。 有关详细信息,请参阅nm的答案。
据我所知, posix_memalign
的唯一好处是:
- 为特定于硬件的目的分配页面对齐(通常为4096或更大的对齐)内存。
- 邪恶的黑客将指针的低
N
位保持为零,这样你就可以在低位存储一个N
位整数。 🙂
各种硬件可能具有malloc
无法满足的对齐要求。 Linux手册页给出了一个这样的例子,我引述:
在许多系统上存在对齐限制,例如,用于直接块设备I / O的缓冲区。 POSIX指定pathconf(path,_PC_REC_XFER_ALIGN)调用,该调用指示需要什么对齐。
一些用途:
-
某些处理器的指令仅适用于大于或等于缓冲区大小的2的幂对齐的数据 – 例如ffts中使用的位反向寻址指令(快速傅里叶变换)。
-
将数据与高速缓存边界对齐以优化多处理应用程序中的访问,以便两个处理器不会同时访问同一高速缓存行中的数据。
基本上,如果您不需要进行荒谬的优化级别和/或您的硬件不要求arrays在特定边界上,那么您可以忘记posix_memalign。