R - 使用 shapiro.test() 应用于数字矩阵给出错误 : all 'x' values are identical

标签 r

我有一个包含 > 110 000 行的 data.frame df 。看起来像这样:

  traking_id         A1_CTRL     A2_CTRL     A3_CTRL     A4_CTRL     A5_CTRL     A1_DEX      A2_DEX      A3_DEX      A4_DEX      A5_DEX
1 ENSMUST00000000001 1.35358e+01 1.03390e+01 1.03016e+01 1.12654e+01 1.22707e+01 1.40684e+01 9.15279e+00 1.17276e+01 1.14550e+01 1.46256e+01
2 ENSMUST00000000003 5.01868e-06 5.59107e-06 1.60922e-01 2.45402e-01 2.18614e-01 2.24124e-01 2.88035e-01 7.18876e-06 1.74746e-06 0.00000e+00
...

我有兴趣对每行执行两次 shapiro.test - 一次针对第 2:6 列中的值,一次针对第 7:11 列中的值。

我想获取函数 shapiro.test 返回的两个对象列表,以便从它们中提取 p.value 列。我想通过使用函数 apply 来做到这一点,但是我的代码

shapiro.test_CTRL <- apply(data.matrix(df[,2:6]), 1, shapiro.test)

返回错误

Error in FUN(newX[, i], ...) : all 'x' values are identical

但是,当我使用 pearson.test 时,一切正常:

pearson.test_CTRL <- apply(data.matrix(df[,2:6]), 1, pearson.test)

仅针对一行计算 shapiro.test 也可以正常工作:

shapiro.test(data.matrix(x[1,2:6]))

我想知道为什么按照我的方式使用 apply 和 shapiro.test 会导致错误以及如何正确执行它?

最佳答案

如果您查看 shapiro.test 的源代码,它包含以下行:

...
        x <- sort(x[complete.cases(x)])
        n <- length(x)
        if (is.na(n) || n < 3L || n > 5000L) 
            stop("sample size must be between 3 and 5000")
        rng <- x[n] - x[1L]
        if (rng == 0) 
            stop("all 'x' values are identical")
...

此错误是由于您的行的值全部相同而触发的。使用以下代码可以触发相同的错误:

mtcars[2,] <- 1
apply(mtcars[,2:5], 1, shapiro.test)

您可以通过测试该条件并返回其他内容来避免此错误:

f <- function(x) {
  if (diff(range(x)) == 0) list() else shapiro.test(x)
}

apply(mtcars[,2:5], 1, f)

关于R - 使用 shapiro.test() 应用于数字矩阵给出错误 : all 'x' values are identical,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34840580/

相关文章:

r - 有没有办法从插入符号 lm 对象生成置信区间?

css - 从R中的链接中提取标题

r - 如何在R饼图中重叠多个值?

r - 计算出现在非缺失值之间的 NA

r - 如何更改 XGboost(R 中)中的损失矩阵?

r - 在 rmarkdown 的 tikz 节点标签中使用项目符号列表

r - 将 R 与 git 和 packrat 一起使用

r - 是否可以使用rMaps在R中的 map 上绘制路线?

r - 添加具有不同数据的图层时,ggplot对象未找到错误

android - 是否可以使用 Honeycomb (Android 3.0) 从平板电脑运行 R?