我正在尝试为其他 numpy.array
制作一个 numpy.array
,用于 Monte Carlo 模拟。我想获取数组的一个元素(另一个 1d 数组)并对其执行一些函数,返回该数组的一个子部分,然后重新分配它。 最初所有数组的长度都相同,这似乎导致了问题。
我想做:例如
c1 = np.array([np.array(xi) for xi in [[1,2],[1],[1,3]]])
c1[2] = np.array([5])
给予的效果很好:
array([array([1, 2]), array([1]), array([5])], dtype=object)
当我进行转换时,我得到了相同类型的结构,使所有子数组的长度都相同。
c2 = np.array([np.array(xi) for xi in [[1,2],[1],[1,3]]])
c2[1] = np.array([4,5])
给予
array([array([1, 2]), array([4, 5]), array([1, 3])], dtype=object).
相反发生的是:例如
当我开始所有长度相同的数组时,它们从 np.arrays
转换为 lists
。
c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
给出
array([[1, 2], [1, 2], [1, 4]]).
现在,如果我尝试调整其中一个列表的长度
c3[1] = np.array([5])
我得到广播
array([[1, 2], [5, 5], [1, 4]])
当我想要的时候
array([array([1, 2]), array([5]), array([1, 4])])
性能问题:
这都是为了蒙特卡洛模拟,通常我希望处理一个包含大约 10'000 个子数组的数组,其中每个子数组是一个包含大约 1'000 个元素( float )的数组。我一直在使用 numpy,因为它的随机数生成速度非常快,而且它对矢量化函数有很好的性能,特别是我最终想对这些函数执行某种累积和 (np.cumsum
),以及其他一些更深奥的功能。我能够用列表来做这种事情,但它花费了大约 20 倍的时间,并且我希望尽可能地进行优化。
非常感谢。
最佳答案
numpy 不允许您更改 np.arrays 的 np.arrays 的形状:
>>> c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
>>> c4 = np.array([c3[:1],np.array([5]), c3[2:]])
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: could not broadcast input array from shape (2) into shape (1)
你可以做的是对 np.empty
使用 dtype=np.ndarry
:
>>> ourList = [[1,2],[1,2],[1,4]]
>>> c3 = np.empty(len(ourList), dtype=np.ndarray)
>>> for i in xrange(len(ourList)):
>>> c3[i] = np.array(outList[i])
>>> c3
array([array([1, 2]), array([1, 2]), array([1, 4])], dtype=object)
>>> c3[1] = np.array([5])
>>> c3
array([array([1, 2]), array([5]), array([1, 4])], dtype=object)
这是您要找的吗?
您可能只想输入一个零或一些不会影响您的模拟的巨大负数/正数:
>>> c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
>>> c3[1] = np.array([5])
>>> c3
array([[1, 2],
[5, 5],
[1, 4]])
>>> c3[1][1] = -9999999
>>> c3
array([[ 1, 2],
[ 5, -9999999],
[ 1, 4]])
关于python - Numpy - 将 np.arrays 自动隐式转换为列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37091483/