我有一个概率向量(当然总和为 1):
prob = [0.1, 0.3, 0.4, 0.2]
现在我需要为这个向量生成一个随机索引(包括 0 到 3 之间的数字),但我希望每个索引的概率由 prob 给出
0 will be generated with prob 0.1
1 will be generated with prob 0.3
2 will be generated with prob 0.4
3 will be generated with prob 0.2
我知道我可以通过计算 cumsum 来做到这一点
cumsum = [0.1, 0.4, 0.8, 1.0]
然后生成一个0到1之间的随机数:
rand_num = np.random.random()
最后使用np.digitize
检查我的随机数落入哪个垃圾箱。
idx = np.digitize([rand_num], cumsum)
这很有效,我对此很满意,digitize 甚至接受数字列表并将它们分类到容器中,因此我可以创建自己的函数来生成给定概率分布的索引。
我的问题是:这是一个常见问题,那么是否已经存在一个函数可以做到这一点? (这比我自己做更有效率)
谢谢
最佳答案
您可以使用 Python 3.6 中的 random.choices
来实现此目的,其中包含一个 weights
参数:
>>> from random import choices
>>> prob = [0.1, 0.3, 0.4, 0.2]
>>> choices(range(len(prob)), weights=prob)
[2]
>>> choices(range(len(prob)), weights=prob)
[3]
>>> choices(range(len(prob)), weights=prob, k=4)
[1, 2, 2, 2]
关于python - 具有自定义概率分布的随机索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50643760/