CUDA 常见问题

CUDA 内置目标弃用通知

Numba 内置的 CUDA 目标已被弃用,后续开发已移至 NVIDIA numba-cuda 包。请参阅 内置 CUDA 目标弃用和维护状态

nvprof 报告“未分析任何内核”

当使用 nvprof 工具对用于 CUDA 目标的 Numba JIT 编译代码进行分析时,输出包含 No kernels were profiled,但明显存在正在运行的内核,这是怎么回事?

这很可能是由于程序退出时分析数据未刷新,详细信息请参见 NVIDIA CUDA 文档。要解决此问题,只需在程序退出点(或您希望停止分析的任何位置)之前添加对 numba.cuda.profile_stop() 的调用。有关 Numba 中 CUDA 分析支持的更多信息,请参阅 分析