regression - Stata clogit 命令与带有手动固定效果的 logit 不能(完全)重现 : Coefficients double

标签 regression stata

谢谢你回答我的问题!我正在 Stata 中实现条件逻辑回归。我有长格式的选择数据,其中每个选择都包含两个可用选项,决策者只能选择一个。我已经使用 Stata clogit 实现了它命令,在我的理解中,它为数据中的每个选择创建固定效应,并在将因变量回归到逻辑回归中剩余的解释变量之前将它们部分化。说服自己clogit做我认为的事情,我试图重现我使用 logit 得到的结果命令并手动添加固定效果。鉴于 Stata 对解释变量数量的限制,FWIW 对于大型数据集并不简单,但问题仍然存在于以下较小的 MWE:

* Retrieve MWE data set
webuse lowbirth2, clear

* Add arbitrary cluster variable, because in my real problem the data is clustered
gen cluster = ceil(_n/14)

clogit low lwt smoke ptd ht ui i.race, group(pairid) cluster(cluster)
    Conditional (fixed-effects) logistic regression

                                                Number of obs     =        112
                                                Wald chi2(7)      =     211.55
                                                Prob > chi2       =     0.0000
Log pseudolikelihood = -25.794271               Pseudo R2         =     0.3355

                                (Std. Err. adjusted for 8 clusters in cluster)
------------------------------------------------------------------------------
             |               Robust
         low |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         lwt |  -.0183757   .0111176    -1.65   0.098    -.0401657    .0034144
       smoke |   1.400656   .4670183     3.00   0.003     .4853172    2.315995
         ptd |   1.808009   .6162347     2.93   0.003      .600211    3.015807
          ht |   2.361152   .9149873     2.58   0.010     .5678096    4.154494
          ui |   1.401929   .5968851     2.35   0.019     .2320559    2.571802
             |
        race |
      black  |   .5713643   .5699717     1.00   0.316    -.5457596    1.688488
      other  |  -.0253148   .5197248    -0.05   0.961    -1.043957    .9933272
------------------------------------------------------------------------------

logit low lwt smoke ptd ht ui i.race i.pairid, cluster(cluster)
Logistic regression                             Number of obs     =        112
                                                Wald chi2(6)      =          .
                                                Prob > chi2       =          .
Log pseudolikelihood = -51.588542               Pseudo R2         =     0.3355

                                (Std. Err. adjusted for 8 clusters in cluster)
------------------------------------------------------------------------------
             |               Robust
         low |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         lwt |  -.0367513   .0222351    -1.65   0.098    -.0803314    .0068288
       smoke |   2.801312   .9340365     3.00   0.003     .9706343     4.63199
         ptd |   3.616018   1.232469     2.93   0.003     1.200422    6.031613
          ht |   4.722303   1.829975     2.58   0.010     1.135619    8.308988
          ui |   2.803858    1.19377     2.35   0.019     .4641118    5.143605
             |
        race |
      black  |   1.142729   1.139943     1.00   0.316    -1.091519    3.376977
      other  |  -.0506296    1.03945    -0.05   0.961    -2.087913    1.986654
             |
      pairid | ... omitted for brevity ...
查看这两个输出,我们可以看到系数、标准误和对数似然不仅不同,而且精确地翻倍 ,就好像因变量被缩放了 2 倍。我应该补充一点,当我不对标准误差进行聚类时,它们不再完全翻倍。所以,clogit似乎不只是部分消除对后端的固定影响,但它有什么作用? documentation也不是 clogit.ado文件本身已经为我解决了这个问题。

最佳答案

您观察到的估计值差异是由于估计值 logit 的附带参数问题造成的偏差。在有限面板中。
Greene (2004)讨论这种偏差,并注意偏差是 (1) 远离零,和 (2) 当 T=2 时高达 100%。
在您的情况下,T 不是时间,而是配对中的个体数量(即 2),因此您应该期望偏差在 100% 左右。
如果您重读 pdf documentation for clogit ,特别是的第二段固定效应 logit 部分下 备注及实例 你会看到如何clogit避免了这个问题。
由于使用 logit 的偏差你所做的是 100% 相对于 clogit您记录的估计系数之间的关系是两个估计量的预期行为(或在 logit 情况下实际上是不当行为)。

关于regression - Stata clogit 命令与带有手动固定效果的 logit 不能(完全)重现 : Coefficients double,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63154312/

相关文章:

r - 从 leaps regsubsets 中获取所有模型

r - R 中的多项式回归 - 对曲线有额外的约束

r - 如何将转换后的回归绘制回原始比例?

rounding - Stata:舍入不正确?

command-line - Stata - 返回文件路径或执行文件位置的命令

r - 在热图上绘制逻辑回归线

r - Julia 中的完美(或接近)多重共线性

r - 在R中加载stata.dta文件并进行数据分析

graphics - 在Stata中,如何组合不同宽度的箱线图?

python - 仅当变量等于某个值(20Gb+ csv 文件)时,如何从 csv 文件中读取行