algorithm - 什么是定义样本值间隔的更有效和准确的算法?

标签 algorithm histogram

Excel、Matplotlib、matlab、R等都可以绘制直方图。在许多情况下,我们必须将原始大样本更改为一组间隔。Wiki 说我们有不同的算法来完成这项任务,但最流行的是平方根选择 article in wiki .在文本中,我没有看到该声明的证据。所以我的问题是:算法最适合这项任务吗? 关于这个问题,你有什么建议可以阅读?

最佳答案

如果您想要第二个意见,并提供更全面的理由,请尝试 Izenman 的“现代多元统计技术......”的第 4.3 节。对于正态分布的特殊情况,他提出了 3.4908*sigma*n^(-1/3) 的 bin 宽度,这非常接近维基百科中的 Freedman-Diacontis 选择。

但是,Izenman 还表明,对于他为生成此 bin 宽度而优化的度量,与其他估计器相比,直方图的表现相当糟糕,因此我建议,如果您准备好努力工作以获得尽可能好的估计,您首先从直方图更改为核密度估计器(Izenman 的第 4.5 节和 http://en.wikipedia.org/wiki/Kernel_density_estimation)

关于algorithm - 什么是定义样本值间隔的更有效和准确的算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5769926/

相关文章:

c++ - 已排序数组的一部分被反转

javascript - 使用不断变化的参数查找值范围的可能排列

javascript - 你能在javascript中的字符串数组中进行二进制搜索吗

r - 我需要 ggplot scale_x_log10() 给我负数和正数作为输出

ruby-on-rails - 如何用两个for循环优化程序

algorithm - 是否有一种已知的算法可以通过数字比较来简化 bool 表达式?

python - 将曲线拟合到直方图并提取函数形式 - Python

android - 使用Android-OpenCV比较图片

r - 如何在R中将条形直方图转换为线直方图

r - 可视化 R 中整数数据的频率