machine-learning - 理解具有多个自变量的多项式回归方程

标签 machine-learning data-science

了解多项式回归。 我知道我们对某种非线性数据集使用多项式回归并给它一条曲线。我知道为单个自变量编写多项式回归的方程,但我不太明白这个方程是如何为 2 个变量构造的?

y = a1 * x1 + a2 * x2 + a3 * x1*x2 + a4 * x1^2 + a5 * x2^2

如果我们有 3 个或更多变量,多项式回归方程是什么?为多个变量开发这些多项式方程背后的逻辑到底是什么?

最佳答案

您可以选择任何您想要的,但一般的“公式”(根据我自己的经验和知识)是:

  • 幂(例如 x1x1^2x1^3 等)直至您选择的数字(许多止于 2) .
  • 叉积(x1 * x2x1 * x3 等)
  • 组合(x1^2 * x2x1 * x2^2 等),然后您甚至可以添加更高的组合(x1 * x2 * x3,您甚至可以在此处添加权力)。

但这很快就会失控,最终您可能会得到太多的功能。

我会坚持 2 的幂,并且不带幂的叉积(仅对),就像您的示例一样,如果您有三个元素,则将所有三个元素相乘,但如果您有超过三个元素,我不会为三胞胎而烦恼。

多项式的想法是,您可以对特征之间的复杂关系进行建模,并且多项式有时可以很好地近似更复杂的关系(本质上并不是真正的多项式)。

我希望这就是您的意思,并且可以帮助您。

关于machine-learning - 理解具有多个自变量的多项式回归方程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56228016/

相关文章:

python - 我可以将 Google 存储 blob 作为 n-d 数组下载到 VM 中吗?

algorithm - 补全稀疏矩阵数据的机器学习算法

python - 如何在冗长的多用户互联网聊天记录中识别特定用户?

machine-learning - 日志文件中的文本聚类

python - 无法在 DataFrame 中添加列名称

python - GaussianMixture 轮廓分析

python-3.x - 如何在 Pytorch 中创建自己的损失函数?

python - PySpark:AttributeError: 'PipelineModel'对象没有属性 'clusterCenters'

python - 根据另一列查找公共(public)列值

algorithm - 自动选择图例的比例(线性、幂、对数)