python - 数据均值/方差的变化会影响svm分类器吗?

标签 python machine-learning scikit-learn svm

我在许多领域看到人们在将数据传递给分类器或学习算法之前缩放数据。我注意到通过做那个分类器会非常快。例如在 python 中 X=preprocessing.scale(X) 在执行 svm.SVC().fit(X,y) 之前使用。这对分类器有什么影响吗?

编辑: X=preprocessing.scale(X) 应该是

Standardize a dataset along any axis Center to the mean and component wise scale to unit variance.

缩放到单位方差有什么影响吗?

最佳答案

您所指的概念称为“特征缩放”。 假设您要预测房价并且您有 2 个特征:

  1. 房屋面积(x1)
  2. 房间数量(x2)

房子的面积将是千平方英尺的数量级,而房间数将在之间变化>1- 4。 在这种情况下,x1 特征将主导目标函数,而 x2 特征将在很大程度上被忽略。因此,为了避免这种情况,我们进行了特征缩放。这确保分类器关注每个特征。

引用资料:

关于python - 数据均值/方差的变化会影响svm分类器吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41548857/

相关文章:

python - 视频在 VLC gui 中播放,但在使用 python libvlc 时不播放

相当于 R "split"函数的 Python

machine-learning - Seq2Seq/NLP/Translation:生成目标语句后,最后的解码器隐藏状态是否带有任何剩余含义?

python - 显示返回 'Mean of empty slice'的行

python - 如何在我的 flask 应用程序中连接浏览器的麦克风?

python - sklearn : shapes not aligned 中的值错误

python - 在 scikit-learn 流水线中插入或删除一个步骤

python - 如何在 sklearn 中编码分类特征?

machine-learning - 我们可以使用预测值进行预测吗?

python-3.x - 如何处理从嵌套交叉验证获得的网格搜索的 best_score?