python - (出人意料地具有挑战性？)Numpy 向量化

我想找到一种方法在我的代码中避免循环。我需要实现以下公式，一开始很简单:

简而言之:索引列表被解析为I。对于 I 中指定的每个索引，需要减去数组 x 中所有后续索引的值。对减去的值进行一些计算。总结一切。完成。

我当前的代码:

def loss(x, indices):
    """ 
    Args:
        x: array_like, dtype=float
        indices: array_like, dtype=int

    Example:
        >>> x = np.array([0.3, 0.5, 0.2, 0.1, 1.2, 2.4, 2.8, 1.5, 3.2])
        >>> indices = np.array([0, 2, 3, 6])
        >>> print(loss(x, indices))
        21.81621815885847
    """

    total = 0.0
    for index in indices:
        # Broadcasting here, as all values from all following indices have
        # to be subtracted from the value at the given i index.
        difference = x[index] - x[index + 1:]

        # Sum all up
        log_addition = 1.0 + np.log(np.abs(difference))
        total += np.sum(log_addition)

    return total

具有挑战性的部分是 'i' 索引随机分布在输出范围内。有什么想法吗？

最佳答案

这是一个基于 NumPy 的矢量化 -

mask = indices[:,None] < np.arange(len(x))
v = x[indices,None] - x
vmasked = v[mask]
log_addition = np.log(np.abs(vmasked))
out = log_addition.sum() + mask.sum()

或者，使用对数定律，我们可以将最后两步替换为 -

out = np.log(np.prod(np.abs(vmasked))).sum() + mask.sum()

将 abs 推出，以便它在标量上运行，它将是 -

out = np.log(np.abs(np.prod(vmasked))).sum() + mask.sum()

同样，我们可以利用 多核 和 numexpr -

import numexpr as ne
out = np.log(np.abs(ne.evaluate('prod(vmasked)'))) + mask.sum()

如果你发现即使v也有太多不需要的元素，我们可以直接去vmasked -

xi = x[indices]
x2D = np.broadcast_to(x, (len(indices),len(x)))
vmasked = np.repeat(xi,mask.sum(1))-x2D[mask]

关于python - (出人意料地具有挑战性？)Numpy 向量化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61267484/

python - (出人意料地具有挑战性？)Numpy 向量化

上一篇：c# - 尝试为 ASP.Net Core 3.1 单元测试创建 Mock.Of<ControllerContext>() 时出错

下一篇：arrays - 如何在导出数据时将 Hive array<Int> 类型转换为 Vertica varchar

python - (出人意料地具有挑战性？)Numpy 向量化

上一篇：c# - 尝试为 ASP.Net Core 3.1 单元测试创​​建 Mock.Of<ControllerContext>() 时出错

下一篇：arrays - 如何在导出数据时将 Hive array<Int> 类型转换为 Vertica varchar

上一篇：c# - 尝试为 ASP.Net Core 3.1 单元测试创建 Mock.Of<ControllerContext>() 时出错