逐行访问矩阵元素与列方式

给出矩阵A[i][j] 。如果我们想添加矩阵的元素，哪种方法更好，为什么？

列明智
划明

从我的角度来看，行方式更好，因为在数组表示元素存储在连续的内存位置，因此访问它们花费的时间更少。但是因为在RAM中获取每个位置需要相同的时间，这是否重要？

利用空间局部性

在C中，矩阵以r ow-major顺序存储。因此，如果访问元素a[i][j] ，则对元素a[i][j+1]的访问可能会到达缓存。不会访问主存储器。缓存比主内存快，因此访问模式很重要。

当然，必须考虑更多因素，例如写访问/读访问，写策略（直写，回写/写分配，无写分配），多级缓存等。但这似乎对这个问题有点过分。

使用分析工具（如cachegrind）获得一些乐趣，并亲自查看。

例如，考虑一个访问4MB矩阵的虚拟程序。查看每种访问模式的未命中率之间的差异。

列访问

 $ cat col_major.c #include  int main(){ size_t i,j; const size_t dim = 1024 ; int matrix [dim][dim]; for (i=0;i< dim; i++){ for (j=0;j


  行访问 
 $ cat row_major.c #include  int main(){ size_t i,j; const size_t dim = 1024 ; int matrix [dim][dim]; for (i=0;i< dim; i++) for (j=0;j



		      	 如果arrays很小，那就不重要了。 如果它们很大，那么读取时间可能会受到影响。 最大的问题是缓存。 如果您不能指望将完整矩阵一次加载到缓存中，那么您希望最大限度地减少遇到的缓存未命中数，因为处理缓存未命中相对耗时。 
 如果arrays真的很大，那么你可以通过引起更多页面交换来获得更大的性能命中率。 



		      	 对于C，处理多维数组的最佳方法是： 
 int a[MAX_I][MAX_J]; for (i = 0; i < MAX_I; ++i) { for (j = 0; j < MAX_J; ++j) { /* process a[i][j] */ } } 
 原因是C语言将数组作为具有偏移量的指针处理，请参阅： C编程语言 。



  C / C ++图片载入
  main（）函数返回值？
	大会指针
使用if语句与逻辑运算符有什么好处？
如何让GCC在进行函数调用时警告无数的参数？
用C加密/解密加密Python脚本
在没有编译的情况下确定`sizeof float`
Calloc结构与指针在C中
用于将EBCDIC printables原位转换为ASCII的C代码
“警告：假设循环不是无限”的解释是什么？
Python ctypes：用运算符包装c ++类

逐行访问矩阵元素与列方式

为什么在运行期间c中接受？

指向C中的字符串？

如何限制C中的scanf函数在输入太长时打印错误？

OpenGL – 2D纹理映射

Linux终端中的游戏：更改图像：打印已打印的文本

C：为什么用％s打印null char会打印“（null）”？

位操作的标准（跨平台）方式

标头包含多个C文件

x86上交换与比较和交换锁的相对性能

如何使用结构创建数据库表