r - R编程中如何标准化数据集?

标签 r machine-learning

我实现了以下代码来规范化 R 中的数据帧。但我收到以下错误

for(i in 1:56){
  clean_data[(clean_data[,i]),i] <-(clean_data[,i] - min(clean_data[,i])) / (max(clean_data[,i]) - min(clean_data[,i]))
}

错误

Error: cannot allocate vector of size 9.9 Gb

还有其他方法可以实现规范化吗?谁能帮我?

最佳答案

您可以使用此代码片段来改进您的代码

max_col <- apply(clean_data[,-1], 2, max)
min_col <- apply(clean_data[,-1], 2, min)
clean_data_scaled <- as.data.frame(scale(clean_data[,-1], center = min_col, scale = max_col - min_col))

clean_data_scaled <- scale(clean_data[, -1])

关于r - R编程中如何标准化数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44990325/

相关文章:

python - Pandas 中的标签平滑(软目标)

r - 当您无法提供颜色美感时手动创建图例

R. GGplot2,具有自定义分位数的 geom_boxplot

machine-learning - 无监督情感分析

python - 机器学习随机森林

python - One-Hot 编码的 Keras 自定义损失

r - 多组的ggplot密度图

r - 如何在两列中查找具有相同值的行?

从 R 中的向量中删除某些元素

machine-learning - 使用神经网络进行音高检测