random - 代表性样本量计算。

标签 random open-source

<分区>

我想手动分析三个大型软件项目的错误报告。三个项目的错误报告总数分别为 10,000、12,000 和 8000。我需要检查错误报告、评论和错误修复文件。手动分析所有错误报告是一项耗时且艰巨的任务。出于这些原因,我想从每个项目中获取错误报告的样本。您能否建议我应该分析每个项目的错误报告数量以形成具有代表性的样本量。

最佳答案

这取决于以下两件事:

信心水平:它告诉您您有多确定。 95% 的置信水平意味着您可以 95% 确定; 99% 的置信水平意味着您可以 99% 确定。大多数研究人员使用 95% 的置信水平。

置信区间(误差范围):它是与实际结果的可接受偏差的正负值。大多数研究人员使用 5% 置信区间。

因此,您可以使用 95% 的置信水平和 5% 的置信区间来生成样本量。

例如,

The population size of project A=10,000
Confidence Level = 95%
Confidence Interval =5%
So, representative sample size=370 (That means you should analyze 370 bug reports for project A)

我通常使用样本量计算器来计算样本量。 ( https://www.surveysystem.com/sscalc.htm#one )

关于random - 代表性样本量计算。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53272092/

相关文章:

open-source - IntelliJ 社区 Perforce 插件

regex - Jenkins 的 ClearCase 插件 - 带有正则表达式的分支

javascript - Threejs 围绕 3d 矩阵 Axis 中的另一个对象旋转一个对象

language-agnostic - 为开源库选择名称

linux - 可视化像维基百科这样的巨大图表

design-patterns - 内容交付网络算法、示例、代码

python - 为特定地区/国家生成随机坐标的轻量级工具?

c++ - 随机生成对象的算法

javascript - 每 X 小时显示两个图像,Javascript

php - 开源语音识别引擎