machine-learning - 稀疏矩阵中的特征缩放和均值归一化

标签 machine-learning

在稀疏矩阵上执行特征缩放和均值归一化是个好主意吗?我有一个 70% 稀疏的矩阵。通常,特征缩放和均值归一化可以提高算法性能,但在稀疏矩阵的情况下,它会添加大量非零项

最佳答案

如果表示稀疏很重要,例如为了适合内存,那么您不能对表示本身进行均值归一化,不。它变得完全稠密并且违背了目的。

通常,您会将均值归一化数学插入公式或计算的另一部分。或者,您可以在访问元素时进行标准化,之前已经计算了平均值和方差。

或者,如果可能的话,您可以选择不需要标准化的算法。

关于machine-learning - 稀疏矩阵中的特征缩放和均值归一化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21875518/

相关文章:

python - 是否有接受距离矩阵和原始向量的Python Isomap 模块?

java - 如何反序列化 OpenNLP 训练的模型?

machine-learning - 如何从train/val损失和精度曲线中选择最佳模型?

machine-learning - 为什么我们在线性回归中使用梯度下降?

machine-learning - 机器学习敏感数据的混淆

machine-learning - 用于逼近微分方程组所需解的神经网络

amazon-web-services - 图像识别/分类中的 AWS Sagemaker 多对象检测

python - 非线性数据上的 k-NN + 降维

machine-learning - 训练和测试数据分割后是否需要验证数据集的独立ID并进行相同分布的统计测试?

machine-learning - 为什么在二元分类中,我们只将输入映射到特征空间?