r - 缺失数据的相关性测试

我想测试我的数据集中的性依赖性，该数据集由序数数据组成。这意味着，我的性别为男性(命名为 1)和女性(命名为 2)，以及不同序数尺度(有些范围从 0-2，其他范围)的几个特征(T1、T2、T3...)从 0-5 - 或者从“不存在”到“强烈表达”)。此外，序数性状数据中存在相当多的缺失条目 (NA)。

<表类=“s-表”> <标题> 性别 T1 <正文> 1 0 2 2 1 不适用 2 1 2 0

为了测试性依赖性，我想使用 Kendall 的 tau 系数。为此，我使用了 cor()和cor.test()与 method = "kendall" 。但是，我不确定我是否做得正确。 cor()的结果让我感到没有安全感:

cor(data$sex, data$T1, method="kendall")
[1] NA

cor.test(data$sex, data$T1, method="kendall")

    Kendall's rank correlation tau

data:  data$sex and data$T1
z = 0.052821, p-value = 0.9579
alternative hypothesis: true tau is not equal to 0
sample estimates:
      tau 
0.0120125

NA 是什么意思？而且结果还可靠吗？或者我犯了一个错误？还有其他建议来测试序数特征中的性依赖性吗？通常，在此类研究设计中，序数数据将被二分(0 和 1)，并使用费舍尔精确检验。然而，二分法不是我的目的，我需要保留序数尺度。

最佳答案

正如@akrun 在评论中提到的，默认情况下，当任一向量中存在任何缺失值时，cor 返回NA。文档here描述了 use 参数的其他选项，特别是“complete.obs”或“pairwise.complete.obs”可能正是您正在寻找的

关于r - 缺失数据的相关性测试，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/75559650/

r - 缺失数据的相关性测试

上一篇：python - Django 查询集显示英文翻译

下一篇：python - 在不计算整个数组的排名的情况下确定现有 numpy 数组中新元素的排名的最快方法是什么？