在C / openCL中使用矢量元素

我正在pyopenCL中编写一个openCL内核，我想在其中寻址向量元素。

在简单的C中，我想要的结果是：

int i = 0; float *vec = (float*)maalloc(sizeof(float)*4); for (i=0;i<4;i++) { vec[i]=2*i; }

在openCL中，矢量的元素以“pythonic”点语法样式访问。

 float4 vec = (float4)(0); for (i=0;i<4,i++) { vec.si = 2*i; /*obviously doesn't work*/ }

因此vec[2]在vec.s2中成为vec.s2 ，因此使用变量访问元素不再简单。但是如何使用变量访问vector元素呢？

OpenCL支持主机端组件和设备端组件（内核）的C，因此您可以使用float数组编写与第一个示例几乎完全相同的内核。内核可能如下所示：

 __kernel void vectorAddition(__global float* vec) { // Get the global thread id in x dimension(eliminates loop) size_t index = get_global_id(0); vec[index] = 2.0f * index; }

然后，您可以指定要使用的线程数，以便对arrays的每个元素执行此操作（使线程数与arrays中的元素相同）。

OpenCL允许使用点表示法进行访问，但这是访问向量数据类型的元素。矢量数据类型可以提供改进的性能，因为可以同时对矢量数据类型中的所有元素执行相同的操作。

例如， float4是一个向量数据类型，它将两个32位浮点数相互存储，形成一个128位结构。然后，您可以一次对所有4个浮点数执行操作。

例如：

 float4 v = (float4)(1.0f, 2.0f, 3.0f, 4.0f); float4 mult_result = v * 2;

这需要一条指令同时进行四次乘法。然后mult_result的值为{2.0f, 4.0f, 6.0f, 8.0f} 。

然后可以使用点表示法来访问float4变量的组件，例如：

 float a = vx; // a = 1.0f float b = mult_result.y; // b = 4.0f

以下是矢量数据类型的摘要：矢量数据类型概述。

在C / openCL中使用矢量元素

Variadic宏和尾随逗号

将数字写入不带stdio的字符串C.

累积成绩点平均计算器写成C.

最后是C链表插入节点

我可以在没有任何操作系统平台的情况下执

如何重置字符串中的位值？

C程序没有正确添加浮点数

程序链接到哪个库提供给定的function？

使用fork（）和exec（）在C中执行命令行管道

在C中使用fwrite时，文件大小限制为2GB？