r - 使用 R 的电信流失生存分析

标签 r sas logistic-regression survival-analysis cox-regression

我正在研究电信流失问题,这是我的数据集。

http://www.sgi.com/tech/mlc/db/churn.data

姓名 - http://www.sgi.com/tech/mlc/db/churn.names

我是生存分析的新手。鉴于训练数据,我的想法是建立一个生存模型来估计生存时间以及基于独立因素预测测试数据的流失/非流失。谁能帮我提供代码或指针关于如何解决这个问题。

准确地说,说我的火车数据已经得到

客户电话使用详情、计划详情、他的帐户使用期限等,以及他是否流失。

使用通用分类模型,我可以预测测试数据的流失与否。现在使用生存分析,我想预测测试数据中生存的期限。

谢谢,
麦迪

最佳答案

如果您仍然感兴趣(或为了那些后来者的利益),我已经编写了一些指南,专门用于使用 R 对客户流失数据进行生存分析。它们涵盖了许多不同的分析技术,所有这些都带有样本数据和R 代码。

基本生存分析:http://daynebatten.com/2015/02/customer-churn-survival-analysis/

基本 cox 回归:http://daynebatten.com/2015/02/customer-churn-cox-regression/

cox 回归中的时间相关协变量:http://daynebatten.com/2015/12/survival-analysis-customer-churn-time-varying-covariates/

cox 回归中的时间相关系数:http://daynebatten.com/2016/01/customer-churn-time-dependent-coefficients/

受限平均生存时间(以美元为单位量化流失的影响):http://daynebatten.com/2015/03/customer-churn-restricted-mean-survival-time/

伪观察(量化与变量流失效应相关的美元 yield /损失):http://daynebatten.com/2015/03/customer-churn-pseudo-observations/

请原谅愚蠢的图像。

关于r - 使用 R 的电信流失生存分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27080207/

相关文章:

r - 如何创建一个根据指定字典重命名列名称的函数?

r - 在 R 包中安装缺少的依赖项

R Shiny 的下载按钮与其他输入元素(如 dateInput)对齐

sql - 如何解决错误180-322 : Statement is not valid or is used out of proper order in SAS without restarting?

r - 在 R 中成对堆叠列

sas将表格插入html电子邮件

python - pandas 中的大而持久的 DataFrame

python - 在python中设置Logistic回归的精确迭代次数

machine-learning - 为什么逻辑回归不使用乘法而不是加法来计算误差矩阵?

python - class_weights 如何应用于 sklearn 逻辑回归?