java - 为什么我在 R 和 Java 中得到简单线性回归的截距值不同?

标签 java r linear-regression

我有用 R 编写的线性回归代码,我必须用 Java 做同样的事情。我用过Apache Commons math为此的图书馆。我在 R 代码和 Java 代码中使用了相同的数据,但得到了不同的截距值。我无法弄清楚我在代码中做了什么愚蠢的事情。

R 代码:

test_trait <- c( -0.48812477 , 0.33458213, -0.52754476, -0.79863471, -0.68544309, -0.12970239,  0.02355622, -0.31890850,0.34725819 , 0.08108851)

geno_A <- as.factor(c("Sub_0001"=1, "Sub_0002"=0, "Sub_0003"=1, "Sub_0004"=2, "Sub_0005"=0, "Sub_0006"=0, "Sub_0007"=1, "Sub_0008"=0, "Sub_0009"=1, "Sub_0010"=0))

geno_B <- as.factor(c("Sub_0001"=0, "Sub_0002"=0, "Sub_0003"=0, "Sub_0004"=1, "Sub_0005"=1, "Sub_0006"=0, "Sub_0007"=0, "Sub_0008"=0, "Sub_0009"=0, "Sub_0010"=0) )

fit <- lm(test_trait ~ geno_A*geno_B)
fit

R 输出:

Call:
lm(formula = test_trait ~ geno_A * geno_B)

Coefficients:
    (Intercept)          geno_A1          geno_A2          geno_B1  
      -0.008235        -0.152979        -0.113192        -0.677208  
geno_A1:geno_B1  geno_A2:geno_B1  
             NA               NA 

Java 代码:

package linearregression;
import org.apache.commons.math3.stat.regression.SimpleRegression;
public class LinearRegression {
    public static void main(String[] args) {

        double[][] x = {{1,0},
                        {0,0},
                        {1,0},
                        {2,1},
                        {0,1},
                        {0,0},
                        {1,0},
                        {0,0},
                        {1,0},
                        {0,0}
        };

        double[]y = { -0.48812477,
                       0.33458213,
                      -0.52754476,
                      -0.79863471,
                      -0.68544309,
                      -0.12970239,
                       0.02355622,
                      -0.31890850,
                       0.34725819,
                       0.08108851
        };
        SimpleRegression regression = new SimpleRegression(true);
        regression.addObservations(x,y);

        System.out.println("Intercept: \t\t"+regression.getIntercept());

    }
}

Java 输出:

Intercept:      -0.08732359363636362

我将非常感谢您的帮助。谢谢!

最佳答案

Java 正在做一个简单的回归,仅将第一个变量解释为数字

> test_trait <- c( -0.48812477 , 0.33458213, -0.52754476, -0.79863471, -0.68544309, -0.12970239,  0.02355622, -0.31890850,0.34725819 , 0.08108851)
> geno_A <- c("Sub_0001"=1, "Sub_0002"=0, "Sub_0003"=1, "Sub_0004"=2, "Sub_0005"=0, "Sub_0006"=0, "Sub_0007"=1, "Sub_0008"=0, "Sub_0009"=1, "Sub_0010"=0)
> fit <- lm(test_trait ~ geno_A)
> fit$coef[1]
(Intercept) 
-0.08732359 

关于java - 为什么我在 R 和 Java 中得到简单线性回归的截距值不同?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14583870/

相关文章:

python - 如何在此图中绘制线性回归线?

r - 将表格从 R 获取到 Libre Office Writer 的最佳方法?

python - Python/Numpy 中的正规方程实现

java - Breakout(游戏项目)-让球位于 Racket 中心-Java

java.util.regex.PatternSyntaxException : Illegal character range near index 71

r - 优化 R 中大数据文件的循环,可能使用 Rcpp

R 在 purrr::map 中使用 dplyr::mutate() 而不复制行

python - 具有强制非零 y 截距的线性回归

java - 安卓按钮不动了?

java - JTable keypressed 事件仅在按下的第一个键时触发