自定义对比在分析中被广泛使用,例如:“这个三水平因子的水平 1 和水平 3 的 DV 值是否有显着差异?”
直观地说,这种对比用单元均值表示为:
c(1,0,-1)
这些对比度中的一个或多个,绑定(bind)为列,形成对比度系数矩阵,例如
mat = matrix(ncol = 2, byrow = TRUE, data = c(
1, 0,
0, 1,
-1, -1)
)
[,1] [,2]
[1,] 1 0
[2,] 0 1
[3,] -1 -1
然而,当涉及到由系数矩阵指定的这些对比时,网络和书籍中有很多(显然是矛盾的)信息。我的问题是哪些信息是正确的?
权利要求 1: contrasts(factor) 采用系数矩阵
在一些示例中,向用户展示了直观的对比度系数矩阵可以通过
contrasts()
直接使用。或 C()
职能。所以它很简单:contrasts(myFactor) <- mat
权利要求 2:变换系数以创建编码方案
在其他地方(例如 UCLA stats),我们被告知系数矩阵(或基矩阵)在使用前必须从系数矩阵转换为对比矩阵。这涉及对系数矩阵进行变换:
(mat')⁻¹
,或者,在 Rish 中:contrasts(myFactor) = solve(t(mat))
此方法需要使用截距的初始列填充矩阵。为了避免这种情况,一些网站建议使用可以处理非方阵的广义逆函数,即
MASS::ginv()
contrasts(myFactor) = ginv(t(mat))
第三种选择:预乘变换,取逆,后乘变换
再次在其他地方(例如来自 SPSS support 的注释),我们学习到正确的代数是:
(mat'mat)-¹ mat'
暗示我创建对比矩阵的正确方法应该是:
x = solve(t(mat)%*% mat)%*% t(mat)
[,1] [,2] [,3]
[1,] 0 0 1
[2,] 1 0 -1
[3,] 0 1 -1
contrasts(myFactor) = x
我的问题是,哪个是正确的? (如果我准确地解释和描述每条建议)。如何在 R 中为
lm
指定自定义对比? , lme
ETC?引用
最佳答案
关于r - R : contrast coefficient matrix or contrast matrix/coding scheme? 中的自定义对比以及如何到达那里?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31818174/