java - 需要一些关于在 java 中计算 Pearson 相关性的正确方向

我正在尝试计算制表符分隔文本文件中 13 个变量之间的 PIL 逊相关性，其中每列都是一个变量。我正在使用 java，希望有人能给我一些关于我应该使用哪些库或哪些函数的指导。我猜我首先需要读取文件的内容，但无法弄清楚如何从本质上使程序知道每一列都像一个数组，这将使我能够进行所需的计算。我本以为 java.io 包将是我开始的最佳位置，但只是无法弄清楚我可以使用哪些类来解决我的问题。我也看过http://commons.apache.org/math/它有一个测量 PIL 逊相关性的函数，但这太简单了，因为这是一项大学作业，我必须从头开始实现它。通过观察 Apache PIL 逊相关性，他们似乎已经像矩阵一样解决了这个问题，其中矩阵的每一列都是一个变量。

很抱歉对我的问题进行了冗长的描述。如果你们知道任何网站或任何好的关键词来搜索或任何其他信息，我将不胜感激。谢谢，阿林德。

最佳答案

您应该能够仅使用标准 java 数学、字符串、文件 I/O 库以及一些数组和循环来完成此操作!

首先阅读本文以了解如何读取文件。 http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

在循环内使用 String.split(String regex) 方法解析 csv 文件。例如strLine.split(",").

通过对 String[] 中的每个字符串使用 Double.parseDouble 将其转换为 double 组

从那里您可以使用 Math.sqrt(double a) 和 Math.pow(double a, double b) 函数以及一些简单的循环来计算每对变量的相关性。

希望这些信息足以帮助您入门，如果您需要更多帮助，请随时回复!

关于java - 需要一些关于在 java 中计算 Pearson 相关性的正确方向，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4420142/

java - 需要一些关于在 java 中计算 Pearson 相关性的正确方向

上一篇：java - 关于jpa 1.0事务并发的问题

下一篇：Java类初始化难题