版本 0.58.0 (2023年9月20日)

Numba在编译时应用的优化级别可以通过环境变量NUMBA_OPT设置。历史上，这是一个介于0和3（含）之间的值。现在已添加对max值的支持，这是一个Numba特有的优化级别，表示用户希望Numba尝试运行尽可能多的优化，这可能会以更长的编译时间换取更好的运行时性能。实际上，使用max优化级别可能不会或会受益于用户代码的运行时或编译时性能，但它的添加是为了给用户提供一个易于访问的选项，以便他们根据需要尝试。

(PR-#9094)

改进 

对`numba.core.pythonapi`的更新。

对Python C-API函数PyBytes_AsString和PyBytes_AsStringAndSize的支持已添加到numba.core.pythonapi.PythonAPI，分别作为bytes_as_string和bytes_as_string_and_size方法。

(PR-#8462)

对`isinstance`的支持现已不再是实验性功能。

对内置函数isinstance的支持已从实验性功能变为完全支持的功能。

(PR-#8911)

NumPy支持 

`numpy.correlate`和`numpy.convolve`中支持所有模式。

现在支持numpy.correlate和numpy.convolve中mode参数的所有值。

(PR-#7543)

`@vectorize`适应实现`__array_ufunc__`的参数。

使用numba.vectorize创建的通用函数（ufuncs）现在将尊重实现__array_ufunc__（NEP-13）的参数，以允许在从解释器调用ufunc时对参数和返回值进行预处理和后处理。

(PR-#8995)

添加了对`np.geomspace`函数的支持。

此PR通过添加对np.geomspace的支持来改进#4074。当前实现仅支持标量start和stop参数。

(PR-#9068)

添加了对`np.vsplit`、`np.hsplit`、`np.dsplit`的支持。

此PR通过添加对np.vsplit、np.hsplit和np.dsplit的支持来改进#4074。

(PR-#9082)

添加了对`np.row_stack`函数的支持。

添加了对numpy.row_stack的支持。

(PR-#9085)

添加了对函数`np.polynomial.polyutils.trimseq`以及`np.polynomial.polynomial`中的函数`polyadd`、`polysub`、`polymul`的支持。

添加了对np.polynomial.polyutils.trimseq、np.polynomial.polynomial.polyadd、np.polynomial.polynomial.polysub、np.polynomial.polynomial.polymul的支持。

(PR-#9087)

添加了对`np.diagflat`函数的支持。

添加了对numpy.diagflat的支持。

(PR-#9113)

添加了对`np.resize`函数的支持。

添加了对numpy.resize的支持。

(PR-#9118)

添加np.trim_zeros

添加了对np.trim_zeros()的支持。

(PR-#9074)

CUDA更改 

CUDA目标位运算`ufunc`支持。

添加了对CUDA目标上与位操作相关的一些ufunc的支持。具体包括：

numpy.bitwise_and
numpy.bitwise_or
numpy.bitwise_not
numpy.bitwise_xor
numpy.invert
numpy.left_shift
numpy.right_shift

(PR-#8974)

添加对最新CUDA驱动程序代码的支持。

添加了对最新一套CUDA驱动程序代码的支持。

(PR-#8988)

在CUDA中添加NumPy比较ufunc

此PR添加了对CUDA目标比较ufunc的支持（例如numpy.greater、numpy.greater_equal、numpy.less_equal等）。

(PR-#9007)

在Linux上报告`libcuda.so`的绝对路径

numba -s现在在Linux上报告libcuda.so的绝对路径，以帮助排查驱动程序问题，尤其是在WSL2上，Linux驱动程序可能在环境中被错误安装。

(PR-#9034)

向`nvdisasm`输出添加调试信息支持。

在通过nvdisasm进行调用的函数中，增加了对调试信息（源行和内联信息）的支持。例如，CUDA调度器.inspect_sass方法的输出现在已通过此信息得到增强。

(PR-#9035)

添加CUDA SASS CFG支持

此PR添加了以dot语言格式获取SASS CFG的支持。它向CUDADispatcher添加了一个inspect_sass_cfg()方法，并向nvdisasm命令行工具添加了-cfg标志。

(PR-#9051)

使用ctypes绑定支持NVRTC

现在在使用ctypes绑定时可以使用NVRTC，从而能够支持float16，并且无需NVIDIA CUDA Python绑定即可链接CUDA C / C++源。

(PR-#9086)

修复CUDA 12.2工具包的原子测试

CUDA 12.2为某些原子操作生成略有不同的PTX，因此在使用12.2时，相关测试会更新以查找正确的指令。

(PR-#9088)

Bug修复 

修复了`numba.typed.List`中不同大小无符号整数索引的处理问题。

修复了numba.typed.List中无符号整数索引截断/扩展和类型转换顺序的问题。

(PR-#7262)

防止无效融合

此PR修复了一个问题：当一个数组在一个parfor中首次读取，随后又在同一parfor中写入时，该数组只被归类为在该parfor中被使用。当随后的另一个parfor也使用同一数组时，就会发生parfor的融合，这在第一个parfor也写入该数组的情况下应该被禁止。此PR将parfor中的此类数组视为既被使用又被定义，从而防止融合。

(PR-#7582)

`numpy.allclose`的实现现在正确处理默认参数。

numpy.allclose的实现已更正，使用TypingError报告类型错误。

(PR-#8885)

向`numpy.isclose`添加类型验证。

类型验证已添加到numpy.isclose的实现中。

(PR-#8944)

修复用不兼容的第一类函数重载调度器的支持

修复了在将Dispatcher对象转换为第一类函数时未处理编译错误导致的问题。修复后，用户现在可以用不兼容的第一类函数重载调度器。详情请参考https://github.com/numba/numba/issues/9071。

(PR-#9072)

支持`numpy.arange`中的`dtype`关键字参数，并设置`parallel=True`

修复了parfors转换，以支持在numpy.arange(..., dtype=dtype)中使用dtype关键字参数。

(PR-#9095)

修复所有`@overload`使用与公共API匹配的参数名称。

Numba中某些用于NumPy和Python内置函数的@overload的参数名称与它们所重载的API中使用的参数名称不匹配。这导致在调用时使用参数名称作为关键字参数调用函数时，会产生编译错误。现在，这个问题已在整个代码库中得到普遍修复，并且正在运行一个单元测试，以尽力防止未来再次引入类似的错误。修复的函数包括：

来自Python内置函数：

complex

来自Python random模块：

random.seed
random.gauss
random.normalvariate
random.randrange
random.randint
random.uniform
random.shuffle

来自numpy模块：

numpy.argmin
numpy.argmax
numpy.array_equal
numpy.average
numpy.count_nonzero
numpy.flip
numpy.fliplr
numpy.flipud
numpy.iinfo
numpy.isscalar
numpy.imag
numpy.real
numpy.reshape
numpy.rot90
numpy.swapaxes
numpy.union1d
numpy.unique

来自numpy.linalg模块：

numpy.linalg.norm
numpy.linalg.cond
numpy.linalg.matrix_rank

来自numpy.random模块：

numpy.random.beta
numpy.random.chisquare
numpy.random.f
numpy.random.gamma
numpy.random.hypergeometric
numpy.random.lognormal
numpy.random.pareto
numpy.random.randint
numpy.random.random_sample
numpy.random.ranf
numpy.random.rayleigh
numpy.random.sample
numpy.random.shuffle
numpy.random.standard_gamma
numpy.random.triangular
numpy.random.weibull

(PR-#9099)

更改 

支持`@numba.extending.intrinsic(prefer_literal=True)`

在高级扩展API中，prefer_literal选项已添加到numba.extending.intrinsic装饰器中，以便在可用时优先使用字面类型。这与numba.extending.overload装饰器中的prefer_literal选项具有相同的行为。

(PR-#6647)

弃用 

弃用旧式`NUMBA_CAPTURED_ERRORS`

添加了NUMBA_CAPTURED_ERRORS=old_style的弃用计划。NUMBA_CAPTURED_ERRORS=new_style将在未来的版本中成为默认设置。详细信息请参阅https://numba.readthedocs.cn/en/stable/reference/deprecation.html#deprecation-of-old-style-numba-captured-errors

(PR-#9090)

拉取请求 (Pull-Requests)

PR #6647: 支持 intrinsic 装饰器的 prefer_literal 选项 (ashutoshvarma sklam)
PR #7262: 修复处理和转换顺序 (esc)
PR #7543: 支持 np.correlate 和 np.convolve 中的所有模式 (jeertmans)
PR #7582: 使用 get_parfor_writes 检测阻止融合的非法数组访问。 (DrTodd13)
PR #8371: 添加二项式分布 (esc kc611)
PR #8462: 添加 PyBytes_AsString 和 PyBytes_AsStringAndSize (ianna)
PR #8633: DOC: 将 vectorize 和 guvectorize 示例转换为 doctest (Matt711)
PR #8730: 更新开发文档 (sgbaird esc)
PR #8792: 添加 towncrier 作为 github 工作流 (kc611)
PR #8854: 更新 mk_alloc 以支持 Numba-Dpex 计算遵循数据。 (mingjie-intel)
PR #8861: CUDA: 不要为 jit 注册表添加 device kwarg (gmarkall)
PR #8871: 不要在 CallConv.decorate_function() 中返回函数 (gmarkall)
PR #8885: 修复 np.allclose 不处理默认参数的问题 (guilhermeleobas)
PR #8892: 在 jitclass 中添加对 __*matmul__ 方法的支持 (louisamand)
PR #8895: CUDA: 启用使用 CG 的缓存函数 (gmarkall)
PR #8906: 在 jitclass 中添加对反射 dunder 方法的支持 (louisamand)
PR #8911: 移除 isinstance 实验性功能警告 (guilhermeleobas)
PR #8916: 将 llvmlite 要求提升到 0.41.0dev0 (sklam)
PR #8925: 更新发布清单模板 (sklam)
PR #8937: 删除旧的网站开发文档 (esc gmarkall)
PR #8944: 为 np.isclose 添加异常处理 (guilhermeleobas)
PR #8974: CUDA: 添加二进制 ufunc 支持 (Matt711)
PR #8976: 修复 ptxcompiler/cubinlinker 包的索引 URL。 (bdice)
PR #8978: 使用 MVCLinker 时导入 MVC 包。 (bdice)
PR #8983: 修复 deprecation.rst 中的拼写错误 (dsgibbons)
PR #8988: 支持最新的 CUDA 驱动程序代码 #8363 (s1Sharp)
PR #8995: 允许实现 __array_ufunc__ 的库覆盖 DUFunc.__c… (jpivarski)
PR #9007: CUDA: 添加比较 ufunc 支持 (Matt711)
PR #9012: RVSDG-前端 (sklam)
PR #9021: 更新 0.57.1rc1 后的发布清单 (esc)
PR #9022: 修复：更新 C++ ABI repo 引用 (emmanuel-ferdman)
PR #9028: 替换在 3.12 中移除的 imp 模块的使用 (hauntsaninja)
PR #9034: CUDA 库测试：报告 Linux 上加载的 libcuda.so 的绝对路径，+ 其他改进 (gmarkall)
PR #9035: CUDA: 允许 nvdisasm 输出中包含调试信息 (Matt711)
PR #9037: 识别更多函数为纯函数或没有副作用。 (DrTodd13)
PR #9039: 更正安装说明中的 git clone 链接。 (ellifteria)
PR #9040: 移除 NVVM 3.4 和 CTK 11.0 / 11.1 支持 (gmarkall)
PR #9046: 将 0.57.1 的更改日志更改复制到主分支 (esc)
PR #9050: 更新 CODEOWNERS (sklam)
PR #9051: 添加 CUDA CFG 支持 (Matt711)
PR #9056: 添加每周会议记录脚本 (esc)
PR #9068: 添加 np.geomspace (KrisMinchev)
PR #9069: 修复由于 importlib_resources 升级导致的 towncrier 错误 (sklam)
PR #9072: 修复用不兼容的第一类函数重载调度器的支持 (gmarkall sklam)
PR #9074: 添加 np.trim_zeros (sungraek guilhermeleobas)
PR #9082: 添加 np.vsplit, np.hsplit, and np.dsplit (KrisMinchev)
PR #9083: 从代码和文档中移除 Windows 32 位引用 (kc611)
PR #9085: 为 np.row_stack 添加测试 (KrisMinchev)
PR #9086: 使用 ctypes 绑定支持 NVRTC (testhound gmarkall)
PR #9087: 添加 np.polynomial.polyutils 中的 trimseq 以及 np.polynomial.polynomial 中的 polyadd, polysub, polymul (KrisMinchev)
PR #9088: 修复：问题 9063 - CUDA 原子测试在 CUDA 12.2 下失败 (gmarkall)
PR #9090: 添加 old_style 错误捕获的弃用通知。 (esc sklam)
PR #9094: 添加对 NUMBA_OPT 环境变量“max”级别的支持。 (stuartarchibald)
PR #9095: 支持 arange_parallel_impl 中的 dtype 关键字 (DrTodd13 sklam)
PR #9105: NumPy 1.25 支持 (PR #9011) 续 (gmarkall apmasell)
PR #9111: 修复 PR#9099 中的 ReST 语法错误 (stuartarchibald gmarkall sklam apmasell)
PR #9112: PR#9100 的修复 (stuartarchibald sklam)
PR #9113: 添加对 np.diagflat 的支持 (KrisMinchev)
PR #9114: 将 np 最小版本更新到 122 (stuartarchibald esc)
PR #9117: 修复 towncrier 模板渲染问题 (kc611)
PR #9118: 添加对 np.resize() 的支持 (KrisMinchev)
PR #9120: 更新 numba-rvsdg 的 conda-recipe (sklam)
PR #9127: 修复意外的 cffi 测试依赖，重构 cffi 跳过逻辑 (gmarkall)
PR #9128: 将 rvsdg_frontend 分支合并到 main (esc sklam)
PR #9152: 修复 old_style 错误捕获弃用警告 (sklam)
PR #9159: 修复 find_file() 中未捕获的异常 (gmarkall)
PR #9173: Towncrier 修复（继续 #9158 并重新定位到 main 分支） (sklam)
PR #9181: 移除 RNG 中多余的 decrefs (sklam)
PR #9190: 修复测试中多进程上下文不兼容的问题。 (stuartarchibald)

添加了towncrier

支持的最低NumPy版本为1.22。

添加对NumPy 1.25的支持

删除NVVM 3.4和CTK 11.0 / 11.1支持

移除对Windows 32位操作系统的支持

最低llvmlite版本现在是0.41.0。

添加了RVSDG-frontend

numba.experimental.jitclass获得对__*matmul__方法的支持。

numba.experimental.jitclass获得对反射-dunder-方法的支持。

添加对NUMBA_OPT中max值的支持。

对numba.core.pythonapi的更新。

对isinstance的支持现已不再是实验性功能。

numpy.correlate和numpy.convolve中支持所有模式。

@vectorize适应实现__array_ufunc__的参数。

添加了对np.geomspace函数的支持。

添加了对np.vsplit、np.hsplit、np.dsplit的支持。

添加了对np.row_stack函数的支持。

添加了对函数np.polynomial.polyutils.trimseq以及np.polynomial.polynomial中的函数polyadd、polysub、polymul的支持。

添加了对np.diagflat函数的支持。

添加了对np.resize函数的支持。

添加np.trim_zeros

CUDA目标位运算ufunc支持。

添加对最新CUDA驱动程序代码的支持。

在CUDA中添加NumPy比较ufunc

在Linux上报告libcuda.so的绝对路径

向nvdisasm输出添加调试信息支持。