python - Numpy修改数组到位？

我有以下代码试图规范化 m x n 数组的值(它将用作神经网络的输入，其中 m 是数字训练样例数，n 是特征数)。

但是，当我在脚本运行后检查解释器中的数组时，我发现这些值没有标准化；也就是说，它们仍然具有原始值。我猜这是因为函数内部对 array 变量的赋值只能在函数内部看到。

我怎样才能就地进行这种规范化？还是我必须从 normalize 函数返回一个新数组？

import numpy

def normalize(array, imin = -1, imax = 1):
    """I = Imin + (Imax-Imin)*(D-Dmin)/(Dmax-Dmin)"""

    dmin = array.min()
    dmax = array.max()

    array = imin + (imax - imin)*(array - dmin)/(dmax - dmin)
    print array[0]


def main():

    array = numpy.loadtxt('test.csv', delimiter=',', skiprows=1)
    for column in array.T:
        normalize(column)

    return array

if __name__ == "__main__":
    a = main()

最佳答案

如果您想就地对 numpy 数组应用数学运算，您可以简单地使用标准的就地运算符 +=、-=、/= 等。例如:

>>> def foo(a):
...     a += 10
... 
>>> a = numpy.arange(10)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> foo(a)
>>> a
array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

这些操作的就地版本启动速度要快一点，尤其是对于较大的阵列:

>>> def normalize_inplace(array, imin=-1, imax=1):
...         dmin = array.min()
...         dmax = array.max()
...         array -= dmin
...         array *= imax - imin
...         array /= dmax - dmin
...         array += imin
...     
>>> def normalize_copy(array, imin=-1, imax=1):
...         dmin = array.min()
...         dmax = array.max()
...         return imin + (imax - imin) * (array - dmin) / (dmax - dmin)
... 
>>> a = numpy.arange(10000, dtype='f')
>>> %timeit normalize_inplace(a)
10000 loops, best of 3: 144 us per loop
>>> %timeit normalize_copy(a)
10000 loops, best of 3: 146 us per loop
>>> a = numpy.arange(1000000, dtype='f')
>>> %timeit normalize_inplace(a)
100 loops, best of 3: 12.8 ms per loop
>>> %timeit normalize_copy(a)
100 loops, best of 3: 16.4 ms per loop

关于python - Numpy修改数组到位？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10149416/

python - Numpy修改数组到位？

上一篇：Python `for` 语法 : block code vs single line generator expressions

下一篇： python "expected an indented block"