是否可以将汇编指令放入CUDA代码中?

我想在CUDA C代码中使用汇编代码
为了减少昂贵的执行
就像我们在c编程中使用asm一样.

可能吗?

最佳答案
不,你不能,没有像C/C++的asm结构.您可以做的是调整生成的PTX程序集,然后将其与CUDA一起使用.

有关示例,请参见this.

但是对于GPU,组件优化不是必需的,您应该首先进行其他优化,例如内存合并和占用.有关更多信息,请参阅CUDA Best Practices guide.

转载注明原文:是否可以将汇编指令放入CUDA代码中? - 代码日志