Tag: ptx

是否可以将汇编指令放入CUDA代码中?

我想在CUDA C代码中使用汇编代码,以减少昂贵的执行,因为我们在c编程中使用asm 。 可能吗?

将PTX程序直接传递给CUDA驱动程序

CUDA驱动程序API提供从文件系统加载包含PTX代码的文件。 通常会做以下事情: CUmodule module; CUfunction function; const char* module_file = “my_prg.ptx”; const char* kernel_name = “vector_add”; err = cuModuleLoad(&module, module_file); err = cuModuleGetFunction(&function, module, kernel_name); 如果在运行时(运行中)生成PTX文件,则通过文件IO似乎是浪费(因为驱动程序必须再次加载它)。 有没有办法直接将PTX程序传递给CUDA驱动程序(例如作为C字符串)?