假设一个黑盒随机数生成器在某个时间间隔内连续发出整数值(对于直接感兴趣的情况,[0, 255])。我想估计概率质量函数及其变化的一些度量,并且我想在新样本进入时定期更新这些估计,而不必存储到目前为止的整个样本集。
- 请建议用于计算和更新这些估计值的数值稳定算法。
- 请建议适当衡量 PMF 变化的方法。
最佳答案
离散分布的 pmf 只是每个结果的相对比例。创建一个长度为 256 的数组,初始化为全零。对于每个值,在该索引处递增数组。按观察总数进行缩放,以将结果表示为相对比例(估计概率)。瞧,即时经验 pmf,即使您有数百万或数十亿个观测值,您也只能存储 256 个值。如果结果仅限于一小部分,请使用散列而不是数组。
给定值和相关计数,您可以构建任何您喜欢的集中趋势或变异度量。对于变异,您可以考虑范围、四分位间距或方差和/或标准差。
关于algorithm - 给定 RNG,运行经验 PMF 及其变化的估计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16343350/