r - 当因变量是因子/分类变量时的线性模型 (lm)?

标签 r lm categorical-data r-factor

我想用 lm 做线性回归功能。我的因变量是一个名为 AccountStatus 的因子:

1:0 days in arrears, 2:30-60 days in arrears, 3:60-90 days in arrears and 4:90+ days in arrears. (4)
作为自变量,我有几个数字变量:Loan to value , debt to incomeinterest rate .
是否可以对这些变量进行线性回归?我在互联网上查看了一些关于 dummy 的信息,但这些都是自变量。
这不起作用:
fit <- lm(factor(AccountStatus) ~ OriginalLoanToValue, data=mydata)
summary(fit)

最佳答案

线性回归不为依赖部分采用分类变量,它必须是连续的。考虑到您的 AccountStatus 变量只有四个级别,将其视为连续是不可行的。在开始任何统计分析之前,应该了解 measurement levels一个人的变量。

你可以做的是使用多项逻辑回归,见 here例如。或者,您可以将 AccountStatus 重新编码为二分并使用简单的逻辑回归。

很抱歉让您失望,但这只是多元回归的固有限制,与 R 无关。如果您想详细了解哪种统计技术适用于因变量和自变量的测量水平的不同组合,我可以竭诚建议this book .

关于r - 当因变量是因子/分类变量时的线性模型 (lm)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22192934/

相关文章:

r - 过滤一列中 > 0 的数据,其余列中 == 0 的数据

r - glm 模型的一个 p 值

javascript - 如何在 R 中的同一箱形图上绘制来自一个数据集的 2 组分类数据

scikit-learn - sklearn中分类数据的递归特征消除?

r - 如何为分类数据创建 'clustered dotplots'?

regex - 基于分隔符的字符串分割

r - 从 "lm"和 "glm"对象中获取输入变量名称的向量

r - 字符串中的总和数 (R)

r - 如何从指定号码(不带名称)中仅提取号码?

r - 将函数中的变量传递给 data.table 以进行 lm()