我有一个 train_data,其中包含有关商店及其销售的信息。看起来像这样
我想构建一个多特征线性回归,通过使用“DayofWeek”、“Customers”、“Promo”来预测 test_data 上的“销售额”。
如何为此构建多元线性回归模型,最好使用 SKlearn。
编辑:这是我正在使用的数据集的链接,如果有人感兴趣的话:https://www.kaggle.com/c/rossmann-store-sales
这是我到目前为止所尝试过的。
import pandas as pd
from sklearn import linear_model
x=train_data[['Promo','Customers','DayOfWeek']]
y=train_data['Sales']
lm=LinearRegression()
lm.fit(x,y)
为此我收到一条错误消息“未定义线性回归”。
最佳答案
您实际上并未导入 LinearRegression
类。如果您想导入 Linear_model 模块中的所有内容(通常不被允许),您可以这样做:
from sklearn.linear_model import *
lr = LinearRegression()
...
更好的做法是导入模块本身并为其指定一个别名。就像这样:
import sklearn.linear_model as lm
lr = lm.LinearRegression()
...
最后你可以只导入你想要的类:
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
...
关于python - 多特征线性回归的实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46531347/