java - 计算具有已知频率的 3 个或更多属性的方差

标签 java statistics machine-learning data-mining

我想计算在给定时间 (t) 收集的数据集中的方差,我们知道该时间的条件属性和决策属性的频率。

每个条件属性可以取 3 个可能的值,而结果由一个两类属性组成,如下图所示。我需要的是计算这个给定数据快照的方差。

我也会对示例代码或算法感兴趣。

! enter image description here

最佳答案

我认为你最好在“statsOverflow”页面上询问这个问题:)

上面的问题对我来说有点不清楚,但在离散情况下,您可以使用以下算法计算方差:


data_type getVariance(data_type[] array){
    data_type mean = getMean(array);
    data_type var = 0;
    for(int i =0; i < array.length; i++){
        var += getProbabilityOf(array[i])*(array[i]-mean)*(array[i]-mean);
    }
    return var;
}
data_type getMean(data_type[] array){
    data_type mean = 0;
    for(int i =0; i < array.length; i++){
        mean += getProbabilityOf(array[i], array)*array[i];
    }
    return mean;
}
double getProbabilityOf(data_type data, data_type[] array){
    return [number of appearances of data in array / size of array];
}

关于java - 计算具有已知频率的 3 个或更多属性的方差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6172746/

相关文章:

java - Netty 有没有办法获取特定的 TCP 选项?

局域网访问mysql

java - SWT 小程序 : swt-win32-3650. dll 已加载到另一个类加载器中

python - 通过超几何分析对 p 值进行 Bonferroni 校正

ruby - 逻辑回归给出不正确的结果

python - 移动标准偏差 Gnuplot

javascript - 是否可以在 ml5.js 中隐藏视频但保留手部姿势点?

java - 验证 Jar 签名

machine-learning - 如何表示神经网络的期望输出以便与实际输出进行比较?

python - 在不同的数据集上运行经过训练的机器学习模型