performance - 如何衡量由许多子基准组成的基准的可变性？

标签 performance optimization statistics benchmarking measurement

(严格来说不是编程，而是程序员需要回答的问题。)

我有一个基准， X ，由很多子基准组成 x1 .. xn .这是一个相当嘈杂的测试，结果非常多变。为了准确地进行基准测试，我必须减少那个“可变性”，这要求我首先测量可变性。

我可以使用标准偏差或方差轻松计算每个子基准的可变性。但是，我想得到一个代表整体可变性的单个数字。

我自己对这个问题的尝试是:

sum = 0
foreach i in 1..n
   calculate mean across the 60 runs of x_i
   foreach j in 1..60
       sum += abs(mean[i] - x_i[j])
variability = sum / 60

最佳答案

最佳创意:ask at the statistics Stack Exchange once it hits public beta (一周以内)。

与此同时:您实际上可能对变异的极端情况更感兴趣，而不是集中趋势(均值等)。对于许多应用程序，我认为通过增加典型用户体验获得的 yield 相对较少，但通过改善最差的用户体验可以获得很多 yield 。尝试标准偏差的第 95 个百分位数并努力减少它。或者，如果您想要减少典型的变异性，则将标准偏差一起绘制。如果它们近似正态分布，我不知道你为什么不能取平均值。

关于performance - 如何衡量由许多子基准组成的基准的可变性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3307186/

上一篇：optimization - OpenGL - glBindTexture - 过早优化？

下一篇：optimization - 在 windows vista 上加速 wamp server + drupal

jquery - 对于每个人来说哪个更快？

java - 为什么当我在 System.out.println 语句之外调用 System.nanoTime() 时，我的程序运行得很快？

Pythonic 检测一维观测数据中异常值的方法

android - 有多少百分比的 Android 设备具有合理的 OpenGL 性能？

perl 简单的效率和可读性

java - case-statement 或 if-statement 效率视角

performance - Spark : why is a subselect with "NOT IN" dramatically slower than "IN"?

mysql - 如何针对大表优化 MySQL 查询

python - 如何在每个波段/箱中以数据百分比作为标签绘制正态分布？