了解多项式回归。 我知道我们对某种非线性数据集使用多项式回归并给它一条曲线。我知道为单个自变量编写多项式回归的方程,但我不太明白这个方程是如何为 2 个变量构造的?
y = a1 * x1 + a2 * x2 + a3 * x1*x2 + a4 * x1^2 + a5 * x2^2
如果我们有 3 个或更多变量,多项式回归方程是什么?为多个变量开发这些多项式方程背后的逻辑到底是什么?
最佳答案
您可以选择任何您想要的,但一般的“公式”(根据我自己的经验和知识)是:
- 幂(例如
x1
、x1^2
、x1^3
等)直至您选择的数字(许多止于 2) . - 叉积(
x1 * x2
、x1 * x3
等) - 组合(
x1^2 * x2
、x1 * x2^2
等),然后您甚至可以添加更高的组合(x1 * x2 * x3
,您甚至可以在此处添加权力)。
但这很快就会失控,最终您可能会得到太多的功能。
我会坚持 2 的幂,并且不带幂的叉积(仅对),就像您的示例一样,如果您有三个元素,则将所有三个元素相乘,但如果您有超过三个元素,我不会为三胞胎而烦恼。
多项式的想法是,您可以对特征之间的复杂关系进行建模,并且多项式有时可以很好地近似更复杂的关系(本质上并不是真正的多项式)。
我希望这就是您的意思,并且可以帮助您。
关于machine-learning - 理解具有多个自变量的多项式回归方程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56228016/