CUDA 常见问题
CUDA 内置目标弃用通知
Numba 内置的 CUDA 目标已被弃用,后续开发已移至 NVIDIA numba-cuda 包。请参阅 内置 CUDA 目标弃用和维护状态。
nvprof 报告“未分析任何内核”
当使用 nvprof
工具对用于 CUDA 目标的 Numba JIT 编译代码进行分析时,输出包含 No kernels were profiled
,但明显存在正在运行的内核,这是怎么回事?
这很可能是由于程序退出时分析数据未刷新,详细信息请参见 NVIDIA CUDA 文档。要解决此问题,只需在程序退出点(或您希望停止分析的任何位置)之前添加对 numba.cuda.profile_stop()
的调用。有关 Numba 中 CUDA 分析支持的更多信息,请参阅 分析。