r - 如何计算/归一化零均值和单位方差

标签 r normalization

什么是“零均值和单位方差”以及如何为 R 中的单列文件计算/标准化它?我还想将归一化值分为两类:

  • 标准化值至少比平均值高 0.5 个标准差 (SD)
  • 标准化值至少低于平均值 0.5 个标准差 (SD)

  • 谢谢

    最佳答案

    引用“零均值和单位方差”意味着归一化变量的均值为 0,标准差(和方差)为 1。在 R 中归一化变量的一种方法是使用 scale功能。下面是一个例子:

    # create vector
    set.seed(1234)
    temp <- rnorm(20, 3, 7)
    
    # take a look
    > mean(temp)
    [1] 1.245352
    > sd(temp)
    [1] 7.096653
    
    # scale vector
    tempScaled <- c(scale(temp))
    
    # take a look
    > mean(tempScaled)
    [1] 1.112391e-17
    > sd(tempScaled)
    [1] 1
    
    # find values below 0.5 standard deviation in scaled vector
    tempScaled[tempScaled < -0.5]
    # find values above 0.5 standard deviation in scaled vector
    tempScaled[tempScaled > 0.5]
    

    您还可以非常轻松地手动缩放变量:
    tempScaled2 <- (temp - mean(temp)) / sd(temp) 
    
    > all.equal(tempScaled, tempScaled2)
    [1] TRUE
    

    关于r - 如何计算/归一化零均值和单位方差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37730926/

    相关文章:

    javascript - 具有如此广泛的值范围的 LSTM 模型(使用 Tensorflow)标准化数据的最佳方法是什么?

    r - 数据框中每个唯一组合的频率

    c++ - 从 C++ 集成 R 代码

    r - 通过命令从列表中找出最大数目

    javascript - String.normalize() 的意义何在?

    c# - 是否有一个 .NET 库来规范化 PCM WAV

    xml - 从 XML 中提取范式

    安卓房间 : Efficient way to transform json result into db object

    r - 如何从 R 列表中删除 "|"而不留空间

    带有movi3ed的RGL视频