我想用 lm
做线性回归功能。我的因变量是一个名为 AccountStatus
的因子:
1:0 days in arrears, 2:30-60 days in arrears, 3:60-90 days in arrears and 4:90+ days in arrears. (4)
作为自变量,我有几个数字变量:Loan to value
, debt to income
和 interest rate
.是否可以对这些变量进行线性回归?我在互联网上查看了一些关于 dummy 的信息,但这些都是自变量。
这不起作用:
fit <- lm(factor(AccountStatus) ~ OriginalLoanToValue, data=mydata)
summary(fit)
最佳答案
线性回归不为依赖部分采用分类变量,它必须是连续的。考虑到您的 AccountStatus 变量只有四个级别,将其视为连续是不可行的。在开始任何统计分析之前,应该了解 measurement levels一个人的变量。
你可以做的是使用多项逻辑回归,见 here例如。或者,您可以将 AccountStatus 重新编码为二分并使用简单的逻辑回归。
很抱歉让您失望,但这只是多元回归的固有限制,与 R 无关。如果您想详细了解哪种统计技术适用于因变量和自变量的测量水平的不同组合,我可以竭诚建议this book .
关于r - 当因变量是因子/分类变量时的线性模型 (lm)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22192934/