python - 在python中生成具有加权概率的随机数

标签 python arrays numpy probability

给定一个正整数数组a,目标是根据它们在数组中的权重生成 5 个随机数。

例如:

a = [2,3,4,4,4,4,4,6,7,8,9]

在这种情况下数字4出现了5次,在这种情况下数字4出现的概率应该是5/11。

任何数字都不应重复。

最佳答案

给定 a,一个正整数数组,您首先需要计算每个整数的频率。例如,使用 bincount:

>>> a = [2,3,4,4,4,4,4,4,5,6,7,8,9,4,9,2,3,6,3,1]
>>> b = np.bincount(a)

b 告诉您 a 中每个整数的出现频率。因此,相应的权重集是数组 b/len(a)。使用具有这些权重的 np.random.choicereplace=False 应该可以满足您的需求:

>>> np.random.choice(np.arange(len(b)), 5, p=b/len(a), replace=False)
array([5, 9, 4, 3, 8])
>>> np.random.choice(np.arange(len(b)), 5, p=b/len(a), replace=False)
array([7, 4, 6, 9, 1])
>>> np.random.choice(np.arange(len(b)), 5, p=b/len(a), replace=False)
array([3, 7, 4, 9, 6])

如果您不只使用正整数,或者如果您使用大的正整数,@user2357112 在下面的评论中指出 np.unique 提供了另一种解决方案。在这里你会写:

>>> choices, counts = np.unique(a, return_counts=True)
>>> np.random.choice(choices, 5, p=counts/len(a), replace=False)
array([9, 8, 2, 4, 5])

关于python - 在python中生成具有加权概率的随机数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34904122/

相关文章:

python - Pandas pd.cut 时间戳 - "ValueError: bins must increase monotonically"

C++ 创建和初始化数组的最佳方式

python - 编写适用于 ndarray 和 MaskedArray 的通用数值函数的最佳实践

numpy - h5py选择性读入

python - 如何舍入 numpy 矢量化函数返回的列表?

python - 检查二叉树是否平衡的时间复杂度

python - 自动生成 PDF

python - 如何从元组列表中的字典中获取值?

java - 元素不应重复

javascript - 数组不能访问元素?