python - numpy 中的数组扩展

我想做的是获取一个输入整数数组，并将其数据扩展为索引(例如，[2, 1] -> [2, 2, 1])。如果术语不正确，我深表歉意——我不确定描述这一点的最佳方式，因此，这可能是重复的。

这是我当前使用的方法的示例:

>>> def expand(a):
...     b = np.empty(a.sum(), dtype=np.int32)
...     idx = 0
...     for i in a:
...         for j in range(i):
...             b[idx] = i
...             idx += 1
...     return b
... 
>>> a = np.array([3, 2, 1, 4])
>>> expand(a)
array([3, 3, 3, 2, 2, 1, 4, 4, 4, 4], dtype=int32)

此方法在嵌套的 for 循环中调用，我想从中挤出额外的性能。以下是当前的计时调用:

>>> a = np.random.randint(0, 1000, 1000)
>>> %timeit expand(a)
10 loops, best of 3: 86.9 ms per loop

是否可以使用不同的方法来降低该方法的费用？

最佳答案

np.repeat 应该可以完成您想要的大部分操作:

a.repeat(a)

我计时 5 毫秒，而你的 88。

你的第一个例子是

arange(2).repeat([2,1])

关于python - numpy 中的数组扩展，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25374038/

上一篇：python - 如何在 Python 中定义 80 位长变量以生成随机.onion 地址？

下一篇：python - 从两个文件的特定列中查找匹配项

相关文章：

python - 用于模糊字符串比较的好 Python 模块？

当文本中有空格时python不写

python - NumPy:连接时出错 - 无法连接零维数组

Python scipy chisquare 返回与 R chisquare 不同的值

python - 如何从 Pandas 邻接矩阵数据帧创建有向网络图？

python - SVM 自定义 RBF 内核 IndexError

python - Python tabula 模块中的这个错误是什么？

python - 如何将 python 中的 .place() 方法转换为 java？

python - 在使用 Python 的 Windows 中，如何终止我的进程？

python - timedelta 不支持的类型