R coxph() 警告 : Loglik converged before variable

标签 r survival-analysis categorical-data cox-regression

我在使用 coxph() 时遇到一些问题。 我有两个分类变量:性别和可能的原因,我想将其用作预测变量。性别只是典型的男性/女性,但可能的原因有 5 个选项。 我不知道警告消息有什么问题。为什么置信区间从 0 到 Inf 并且 p 值如此高?

这是代码和输出:

> my_coxph <- coxph(Surv(tempo,status) ~ factor(Sexo)+ factor(Causa.provavel) ,           data=ceabn)
Warning message:
In fitter(X, Y, strats, offset, init, control, weights = weights,  :
Loglik converged before variable  2,3,5,6 ; beta may be infinite. 

> summary(my_coxph)
Call:
coxph(formula = Surv(tempo, status) ~ factor(Sexo) + factor(Causa.provavel), 
data = ceabn)

n= 43, number of events= 31 

                                            coef exp(coef)  se(coef)     z Pr(>|z|)
factor(Sexo)macho                      7.254e-01 2.066e+00 4.873e-01 1.488    0.137
factor(Causa.provavel)caca             2.186e+01 3.107e+09 9.698e+03 0.002    0.998
factor(Causa.provavel)colisao linha MT 1.973e+01 3.703e+08 9.698e+03 0.002    0.998
factor(Causa.provavel)indeterminado    9.407e-01 2.562e+00 1.683e+04 0.000    1.000
factor(Causa.provavel)predacao         2.170e+01 2.655e+09 9.698e+03 0.002    0.998
factor(Causa.provavel)predado          2.276e+01 7.659e+09 9.698e+03 0.002    0.998

                                       exp(coef) exp(-coef) lower .95 upper .95
factor(Sexo)macho                      2.065e+00  4.841e-01    0.7947     5.368
factor(Causa.provavel)caca             3.107e+09  3.219e-10    0.0000       Inf
factor(Causa.provavel)colisao linha MT 3.703e+08  2.701e-09    0.0000       Inf
factor(Causa.provavel)indeterminado    2.562e+00  3.904e-01    0.0000       Inf
factor(Causa.provavel)predacao         2.655e+09  3.766e-10    0.0000       Inf
factor(Causa.provavel)predado          7.659e+09  1.306e-10    0.0000       Inf

Concordance= 0.752  (se = 0.059 )
Rsquare= 0.608   (max possible= 0.987 )
Likelihood ratio test= 40.23  on 6 df,   p=4.105e-07
Wald test            = 7.46  on 6 df,   p=0.2807
Score (logrank) test = 30.48  on 6 df,   p=3.183e-05

谢谢

最佳答案

几年前,当我向 Terry Therneau(《pkg:survival》的作者)询问此事时,他说触发生成该警告的测试过于敏感。一般来说,警告是不正确的。您通常只需查看系数即可发现它们不是无限的,甚至不是实际上无限的。

但是,就您的情况而言,它似乎正确地警告您,您的数据或应用于您的数据的模型可能存在问题,因为您的系数大得令人难以置信。指数模型中的 beta 系数为 2.276e+01 (= 22.7),高得离谱。 (你有 4 个这样的系数。)估计的相对风险远远超过一百万!您应该查看数据的表格分类,以了解完全分离的问题。你的对照组中有没有人死亡,呃,发生了事件?

此类问题最好通过表格来解决:

table(outcome, treatment_variable, selected_categorical_covariates)

关于R coxph() 警告 : Loglik converged before variable,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19369314/

相关文章:

r - 使用插入符号包构建模型时如何跟踪进度?

R:是否可以围绕拟合模型绘制数据?

r - 在没有审查案例时使用 tidycmprsk (R)

r - R 中的 survreg 有问题吗?

r - 在 Dockerfile 中为 R 添加 CRAN 镜像/PPA

返回具有多次出现的列值的 df

r - 使用 ggplot 移动绘图

r - 请遗漏数据

Python:结合低频因素/类别计数

mysql - SQL子查询获取总数