python - 自定义numpy的向量化运算的效率问题

我有一个 python 函数如下:

def myfun(x):
    if x > 0:
        return 0
    else:
        return np.exp(x)

哪里np是 numpy图书馆。我想在 numpy 中使函数矢量化，所以我使用:

vec_myfun = np.vectorize(myfun)

我做了一个测试来评估效率。首先，我生成一个包含 100 个随机数的向量:

x = np.random.randn(100)

然后我运行以下代码来获取运行时:

%timeit np.exp(x)

%timeit vec_myfun(x)

np.exp(x) 的运行时间是1.07 µs ± 24.9 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each) .

vec_myfun(x) 的运行时间是71.2 µs ± 1.68 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

我的问题是:与 np.exp 相比, vec_myfun只有一个额外的步骤来检查 $x$ 的值，但它比 np.exp 运行得慢得多.有没有一种有效的矢量化方式 myfun使其与np.exp一样高效？

最佳答案

使用np.where:

>>> x = np.random.rand(100,)
>>> %timeit np.exp(x)
1.22 µs ± 49.4 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
>>> %timeit np.where(x > 0, 0, np.exp(x))
4.09 µs ± 282 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

相比之下，您的向量化函数在我的机器上运行时间约为 30 微秒。

至于为什么运行的慢，只是比np.exp复杂多了。它进行了大量的类型推导、广播，并且可能对实际方法进行多次调用。其中大部分发生在 Python 本身，而调用 np.exp(以及此处的 np.where 版本)的几乎所有内容都在 C 中。

关于python - 自定义numpy的向量化运算的效率问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52472531/

上一篇：python - 星号 `` 在 Python 3 的字符串格式化方法 `.format() ` 中如何工作？

下一篇：python - 如何在 Django 管理页面中添加多个自动完成

相关文章：

python - 函数中的矩阵 View 没有副作用

python - DataFrame:如何根据行的另一个单元格切换单元格值？

python - 将 DICOM 图像转换为 XYZ 坐标及其值的列表 - Python

python - 根据其他两列的 bool 值返回一个 bool 值

Python破坏内容以节省内存

python - 如何在 Python 3 中将 SubElement 的内容包装在 XML 标记中？

numpy - 在 numpy 1.8 和 1.9 nansum 之间强制执行兼容性？

python - 如何有效地获取 DataFrame 行的索引，这些行满足特定的累积条件？

r - 为矩阵向量化 min()

c - 信息 C5012 : loop not parallelized due to reason '1008'

python - 自定义numpy的向量化运算的效率问题

上一篇：python - 星号 `*` 在 Python 3 的字符串格式化方法 `.format(*) ` 中如何工作？

下一篇：python - 如何在 Django 管理页面中添加多个自动完成

上一篇：python - 星号 `` 在 Python 3 的字符串格式化方法 `.format() ` 中如何工作？