复制到CUDA常量内存时设备符号无效

我在图像处理中有一个应用程序的几个文件.由于在执行某些图像处理算法时图像的行数和列数没有变化,我试图将这些值放在常量内存中.我的应用看起来像:

Imageproc.cuh

...
...
__constant__ int c_rows;
__constant__ int c_cols;

#ifdef __cplusplus
   extern "C"
   {
#endif
   ...
   ...
#ifdef __cplusplus
   }
#endif

Imageproc.cu

...
...

int algorithm(float *a, const int rows, const int cols){
   ...
   ...
   checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
   checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));

   dim3 block(T, T);
   dim3 grid(cols/T+1, rows/T+1);

   kernel<<<grid, block>>>( ... );
   ...
   ...

}

它编译得很好,但在尝试运行程序时,我得到了无效的设备符号cudaMemcpyToSymbol(& c_rows,& rows,sizeof(int))

我不能把这些变量放在常量内存中或者我缺少什么?

最佳答案
如果您的符号声明如下:

__constant__ int c_rows;

然后正确调用cudaMemcpyToSymbol就是这样

int rows = 5;
cudaMemcpyToSymbol(c_rows, &rows, sizeof(int)));

转载注明原文:复制到CUDA常量内存时设备符号无效 - 代码日志