python - 如何在多线回归中对解释变量求平方

标签 python pandas numpy regression

因此,我希望将解释变量空气质量和吸烟状况以及吸烟状况的平方作为线性回归的一部分。因此,我可以通过在我正在读取的 .csv 文件中添加值来轻松解决这个问题,但我想使用 python 来操作它。有没有办法通过平方并利用多线回归的一部分来控制吸烟状况?我的 csv 文件只有 3 列,包括空气质量、吸烟状况和哮喘。

x = df[['Air_quality', 'Smoking_Status']]
y = df['Asthma_Death_Rate']

x = sm.add_constant(x)

est = sm.OLS(y,x).fit()

最佳答案

要在数据框中对吸烟状态进行平方:

df['Smoking_Status'] = df['Smoking_Status']**2

或者下面较慢的循环版本

df['Smoking_Status'] = df['Smoking_Status'].apply(lambda x: x * x)

参见How to use Apply了解更多详情。这将覆盖数据框中吸烟状态的值。

关于python - 如何在多线回归中对解释变量求平方,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52956500/

相关文章:

python - 基本授权凭证不会出现在 Scapy 中?

python - 将字典的值及其计数转换为另一个字典

python - 如何将数据框插入 Pandas 中的数据框

python - 使用 Python 和 Pandas 拆分文本文件中的数据

python - 两个数据帧之间的相关性

python - 使用 DataFrame 索引日期创建日期列

python - 值错误: cannot reindex from a duplicate axis using groupy and apply pct_change in Pandas

python - 比较数组中的 np.nan 时 "less"中的无效值

python - 如何在 Numpy 中使用数组作为它自己的索引

python - 我的可折叠 Pane 中的控件不可单击(wxPython)