java - 需要一些关于在 java 中计算 Pearson 相关性的正确方向

标签 java matrix statistics correlation pearson

我正在尝试计算制表符分隔文本文件中 13 个变量之间的 PIL 逊相关性,其中每列都是一个变量。我正在使用 java,希望有人能给我一些关于我应该使用哪些库或哪些函数的指导。我猜我首先需要读取文件的内容,但无法弄清楚如何从本质上使程序知道每一列都像一个数组,这将使我能够进行所需的计算。我本以为 java.io 包将是我开始的最佳位置,但只是无法弄清楚我可以使用哪些类来解决我的问题。我也看过http://commons.apache.org/math/它有一个测量 PIL 逊相关性的函数,但这太简单了,因为这是一项大学作业,我必须从头开始实现它。通过观察 Apache PIL 逊相关性,他们似乎已经像矩阵一样解决了这个问题,其中矩阵的每一列都是一个变量。

很抱歉对我的问题进行了冗长的描述。如果你们知道任何网站或任何好的关键词来搜索或任何其他信息,我将不胜感激。谢谢,阿林德。

最佳答案

您应该能够仅使用标准 java 数学、字符串、文件 I/O 库以及一些数组和循环来完成此操作!

首先阅读本文以了解如何读取文件。 http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

在循环内使用 String.split(String regex) 方法解析 csv 文件。例如strLine.split(",").

通过对 String[] 中的每个字符串使用 Double.parseDouble 将其转换为 double 组

从那里您可以使用 Math.sqrt(double a) 和 Math.pow(double a, double b) 函数以及一些简单的循环来计算每对变量的相关性。

希望这些信息足以帮助您入门,如果您需要更多帮助,请随时回复!

关于java - 需要一些关于在 java 中计算 Pearson 相关性的正确方向,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4420142/

相关文章:

java - 如何为 Java 应用程序提供 HTTP 管理控制台?

R 矩阵求逆的不一致乘积

matlab - 在 Octave/Matlab 的 arrayfun 中使用 if 子句

performance - 如何快速用所有N-Ary数字填充矩阵?

java - 能否以 map-reduce 的方式计算一组数据的百分位数?

r - 如何在 R 中生成给定分布、均值、SD、偏斜和峰度分布?

java - JPA存储库表不保存新的ID,而是覆盖或修改

从 spring-hadoop 调用的 Java 8 无法识别 Javascript 引擎 (Nashorn)

java - BigDecimal 导致 NumberFormatException

mysql - Httparchive - BigQuery 如何获取 2010-2014 年每年的中位数 bytesTotal