r - 缺失数据的相关性测试

标签 r correlation missing-data

我想测试我的数据集中的性依赖性,该数据集由序数数据组成。这意味着,我的性别为男性(命名为 1)和女性(命名为 2),以及不同序数尺度(有些范围从 0-2,其他范围)的几个特征(T1、T2、T3...)从 0-5 - 或者从“不存在”到“强烈表达”)。此外,序数性状数据中存在相当多的缺失条目 (NA)。

<表类=“s-表”> <标题> 性别 T1 <正文> 1 0 2 2 1 不适用 2 1 2 0

为了测试性依赖性,我想使用 Kendall 的 tau 系数。为此,我使用了 cor()cor.test()method = "kendall" 。但是,我不确定我是否做得正确。 cor()的结果让我感到没有安全感:

cor(data$sex, data$T1, method="kendall")
[1] NA
cor.test(data$sex, data$T1, method="kendall")

    Kendall's rank correlation tau

data:  data$sex and data$T1
z = 0.052821, p-value = 0.9579
alternative hypothesis: true tau is not equal to 0
sample estimates:
      tau 
0.0120125 

NA 是什么意思?而且结果还可靠吗?或者我犯了一个错误?还有其他建议来测试序数特征中的性依赖性吗?通常,在此类研究设计中,序数数据将被二分(0 和 1),并使用费舍尔精确检验。然而,二分法不是我的目的,我需要保留序数尺度。

最佳答案

正如@akrun 在评论中提到的,默认情况下,当任一向量中存在任何缺失值时,cor 返回NA。文档here描述了 use 参数的其他选项,特别是“complete.obs”或“pairwise.complete.obs”可能正是您正在寻找的

关于r - 缺失数据的相关性测试,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75559650/

相关文章:

r - 使用指定的分页符将列表中的多个 ggplot 排列在多个页面上

R - Caret - 在模型训练中使用 ROC 而不是准确性

r - ggplot facet_wrap 斜体

matlab - 每次计算时,两个随机信号之间的相关性都会发生变化

python - 直方图相关特定列

非数值数据帧上的 R 相关性

r - 使用 ARIMA 模型估算缺失值

python - 在numpy数组中用随机替换缺失值

julia - 在 Julia : Find the mean of an array with missing values

r - 获取相邻值的连通分量