稍微偏离主题的问题,但我想知道是否有人可以告诉我 cor() 函数最近何时以及如何改进?它比我内存中的要快得多,现在的速度可与 HMisc 包中的 rcorr 函数相媲美,这是我用于大型矩阵的替代相关函数。
感谢大家的建议: 经过一番调查,速度差异是由于使用 use="pairwise"标志而不是算法更改造成的。使用此选项时,速度差异约为 8 倍。
R 版本 2.4 - 2.13 中 cor() 的速度是相当的。
谢谢
伊恩
最佳答案
http://cran.r-project.org/src/base/NEWS.html对最近的变化进行了高度总结,并解释了它们的相关性。有时,这对于获取其他函数中可能影响您正在执行的操作的相关更改很有用。然而,快速查找 cor()
仅显示了一些内容:
2.13.0
使用 use = "complete.obs"的 cor() 和 cov() 的排名相关方法在删除缺失值之前计算排名,而文档暗示首先删除不完整的情况。 (https://bugs.R-project.org/bugzilla3/show_bug.cgi?id=14488PR#14488)
2.11.0
cor() 和 cov() 现在测试非数字参数的误用,例如非错误报告 https://bugs.R-project.org/bugzilla3/show_bug.cgi?id=14207PR#14207 。
关于performance - cor() 函数是如何加速的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7795998/