我被要求在我们的数据上绘制一个覆盖正态分布的直方图。我们的数据是一个范围不受限制的 double 数组。接下来是思路:
- 将我所有的值拆分到桶中(我在我的代码中称它们为步骤)
- 找到恰好在每个桶内的所有值
- 计算桶中的项目数并将它们除以总体项目数
- 将 mu 计算为 avg(values)
- 计算方差为 avg([(每个值 - mu)^2])
- 用公式绘制叠加层:1./Sqrt(2 * Pi * var)* e^((-(x - mean)^2/2/var)
这是我到目前为止写的:
double[] values;
const int StepsNumber = 30;
// Choosing the size of each bucket
double step = (values.Max() - values.Min())/StepsNumber;
double mean = values.Average();
double deviationSq = values.Select(x => Math.Pow(x - mean, 2)).Average();
var bucketeer = new Dictionary<double, double>();
for (double curr = values.Min(); curr <= values.Max(); curr += step)
{
// Counting the values that can be put in the bucket and dividing them on values.Count()
var count = values.Where(x => x >= fromVal && x < fromVal + step).Count();
bucketeer.Add(fromVal, count / values.Count());
}
// Then I build normal distribution overlay
var overlayData = new LineSeries();
int x0 = values.Min();
int x1 = values.Max();
for (int i = 0; i < n; i++)
{
double x = x0 + (x1 - x0) * i / (n - 1);
double f = 1.0 / Math.Sqrt(2 * Math.PI * varianceSq) * Math.Exp(-(x - mean) * (x - mean) / 2 / varianceSq);
overlayData .Points.Add(new DataPoint(x, f));
}
// And draw everything
plotModel.Series.Add(overlayData);
foreach (var pair in bucketeer.OrderBy(x => x.Key))
{
columnSeries.Items.Add(new RectangleBarItem(pair.Key, 0, pair.Key + step, pair.Value));
}
plotModel.Series.Add(columnSeries);
但是结果看起来有点奇怪:
直方图似乎与叠加层不匹配。感觉好像我遗漏了一些东西——要么计算错误,要么在数学上有错误。
最佳答案
这个问题现在已经很陈旧了,但是我在尝试做类似的事情时发现了它,所以我会提供以下建议:
首先,varianceSq
变量实际上应该是方差(或标准差的平方)。
其次,根据均值和标准差计算 f
的标准公式生成了一条曲线,其下方的面积为 1。要匹配直方图,您需要按直方图矩形的总面积放大值
即y = f *(条宽 * 条高的总和)
。
关于c# - 从数据绘制具有正态分布叠加的直方图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27134057/