我在许多领域看到人们在将数据传递给分类器或学习算法之前缩放数据。我注意到通过做那个分类器会非常快。例如在 python 中 X=preprocessing.scale(X)
在执行 svm.SVC().fit(X,y)
之前使用。这对分类器有什么影响吗?
编辑:
X=preprocessing.scale(X)
应该是
Standardize a dataset along any axis Center to the mean and component wise scale to unit variance.
缩放到单位方差有什么影响吗?
最佳答案
您所指的概念称为“特征缩放”。 假设您要预测房价并且您有 2 个特征:
- 房屋面积(x1)
- 房间数量(x2)
房子的面积将是千平方英尺的数量级,而房间数将在之间变化>1- 4。 在这种情况下,x1 特征将主导目标函数,而 x2 特征将在很大程度上被忽略。因此,为了避免这种情况,我们进行了特征缩放。这确保分类器关注每个特征。
引用资料:
关于python - 数据均值/方差的变化会影响svm分类器吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41548857/