我有三列。 A 列由数字组成,B 列由 bin 范围组成,C 列由与 A 列中的各个数据相关的数字数据组成。
使用 A 列和 B 列,我创建了一个频率直方图,其中 A 列中的所有数据都已分组到 B 列的箱中。我想使用 C 列中的数据计算每个箱的平均值(即,使用 C 列中与构成每个 bin 的每个值(来自 A 列)相关联的数据计算每个 bin 的平均值。
有人可以帮忙吗?
感谢您的回复。这是数据示例(不幸的是我无法粘贴图像):
下面是三列,标题为 jar 类型(体积(毫升))、 cookies ( jar 中巧克力 cookies 的数量)和垃圾箱间隔(统计 jar 类型的垃圾箱):
- Jar 类型-cookies-垃圾箱间隔
- 500 3 100
- 500 1 150
- 500 0.5 200
- 250 3 250
- 150 1 300
- 500 1 350
- 150 2 400
- 250 2 450
- ### # 500
制作 jar 类型频率的直方图可以得出以下分组:
- Bin 频率
- 100 0
- 150 2
- 200 0
- 250 2
- 300 0
- 350 0
- 400 0
- 450 0
- 500 4
- 更多0
现在我想做的是找出每种类型的 jar 中可以找到的 cookies 的平均数量是多少。例如,对于 500 毫升,我们知道有 4x500 毫升 jar ,每个 500 毫升 jar 里总共有 3+1+0.5+1 = 5.5 block cookies 。平均值为 1.735 个 cookie。
我的问题是,我有 5000 多个号码,分为 100 个垃圾箱。
最佳答案
该问题要求散点图的“徘徊轨迹”:A 列的值(将它们绘制在水平轴上)被放入箱中,因此在散点图中包含垂直 strip 。 C 列的值(绘制在垂直轴上)是每个 strip 内的平均值。此技术可以平滑并总结散点图中的明显趋势。
在此示例中,有 100 条记录,原始数据为黑色,计算值为绿色。这是手段的徘徊痕迹:
空心圆圈根据 A
列(数据)绘制列 C
(相关值),而用红色虚线迹线连接的实心方 block 则绘制 bin 均值( G
列)相对于中点(F
列)。
任何统计包都将提供对数据进行分组并对这些组执行操作的功能。 Excel 通过其 SUMIF
和 COUNTIF
函数在一定程度上实现了这一点。要使用它们,请创建一个显示分组因素的列(电子表格中的D
)。 (这是使用“range”选项设置为 true 的 VLOOKUP
函数在排序的 BINS
向量中进行的简单查找。)SUMIF
计算总和组因子和 COUNTIF
按组因子进行计数。它们的比率是 bin 均值。
以下是公式:
实际只输入了三个公式,然后根据需要复制下来:
=VLOOKUP(A2, Bins, 1, TRUE)
计算单元格A2
中的值的组。Bins
B
列中数组 $(-2,-3,\ldots, 3)$ 的名称。=AVERAGE(B3:B4)
计算第一个 bin 的中点。这用作散点图中的水平绘图位置。=SUMIF(Bin,"="&B3,NewValues)/COUNTIF(Bin, "="&B3)
是完成所有工作的地方。Bin
指的是 D 列中的组代码,NewValues
指的是 C 列中的关联值。棘手的部分是构造"="&B3
:这些形成一个文本值,指示通过与单元格B3
中的数字(第一个端点)进行比较来对数据进行分组。因为这是一个公式,将其复制下来会自动将B3
更新为B4
,然后是B5
,依此类推。
关于excel - 如何计算链接到组成直方图的每个频率箱的一列数字的平均值,Excel 2010?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18599636/