我想测试我的数据集中的性依赖性,该数据集由序数数据组成。这意味着,我的性别为男性(命名为 1)和女性(命名为 2),以及不同序数尺度(有些范围从 0-2,其他范围)的几个特征(T1、T2、T3...)从 0-5 - 或者从“不存在”到“强烈表达”)。此外,序数性状数据中存在相当多的缺失条目 (NA)。
为了测试性依赖性,我想使用 Kendall 的 tau 系数。为此,我使用了 cor()
和cor.test()
与 method = "kendall"
。但是,我不确定我是否做得正确。 cor()
的结果让我感到没有安全感:
cor(data$sex, data$T1, method="kendall")
[1] NA
cor.test(data$sex, data$T1, method="kendall")
Kendall's rank correlation tau
data: data$sex and data$T1
z = 0.052821, p-value = 0.9579
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.0120125
NA 是什么意思?而且结果还可靠吗?或者我犯了一个错误?还有其他建议来测试序数特征中的性依赖性吗?通常,在此类研究设计中,序数数据将被二分(0 和 1),并使用费舍尔精确检验。然而,二分法不是我的目的,我需要保留序数尺度。
最佳答案
正如@akrun 在评论中提到的,默认情况下,当任一向量中存在任何缺失值时,cor
返回NA
。文档here描述了 use
参数的其他选项,特别是“complete.obs”或“pairwise.complete.obs”可能正是您正在寻找的
关于r - 缺失数据的相关性测试,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75559650/