我们什么时候需要使用posix_memalign而不是malloc?

似乎posix_memalign允许您选择自定义alignment ,但何时需要?

malloc已经在内部完成了对齐工作。

UPDATE

我问这个的确切原因是因为我看到nginx这样做, ngx_memalign(NGX_POOL_ALIGNMENT, size, log); ,这里NGX_POOL_ALIGNMENT被定义为16 , nginxs.googlecode.com/svn-history/trunk/src/core/ngx_palloc.c

基本上,如果你需要比malloc更强的对齐方式给你。 Malloc通常返回一个对齐的指针,它可以与任何基本类型一起使用(通常,在普通台式机上使用8个字节)。

但是,有时您需要在其他边界上对齐内存,例如4K对齐等。在这种情况下,您需要memalign

你需要这个,例如,

  • 在编写内存管理器(例如垃圾收集器)时。 在这种情况下,使用在较大块大小上对齐的内存有时很方便。 这样,您可以存储分配区域底部给定块中所有对象共有的元数据,并通过屏蔽对象指针的最低有效位来访问它。
  • 当与硬件连接时(我自己从未这样做,但IIRC,某些类型的块设备需要对齐的内存)。 有关详细信息,请参阅nm的答案。

据我所知, posix_memalign的唯一好处是:

  1. 为特定于硬件的目的分配页面对齐(通常为4096或更大的对齐)内存。
  2. 邪恶的黑客将指针的低N位保持为零,这样你就可以在低位存储一个N位整数。 🙂

各种硬件可能具有malloc无法满足的对齐要求。 Linux手册页给出了一个这样的例子,我引述:

在许多系统上存在对齐限制,例如,用于直接块设备I / O的缓冲区。 POSIX指定pathconf(path,_PC_REC_XFER_ALIGN)调用,该调用指示需要什么对齐。

一些用途:

  • 某些处理器的指令仅适用于大于或等于缓冲区大小的2的幂对齐的数据 – 例如ffts中使用的位反向寻址指令(快速傅里叶变换)。

  • 将数据与高速缓存边界对齐以优化多处理应用程序中的访问,以便两个处理器不会同时访问同一高速缓存行中的数据。

基本上,如果您不需要进行荒谬的优化级别和/或您的硬件不要求arrays在特定边界上,那么您可以忘记posix_memalign。