我试图理解 R 提供的 scale
的定义。我想用数据 (mydata
) 制作热图,并且存在非常强的正偏斜。我已经为 scale(mydata)
和 log(my data)
创建了带有树状图的热图,并且两者的树状图都不同。为什么?缩放数据与对数据进行日志转换意味着什么?如果我想查看说明数据列之间关系的树状图,哪一个更合适?
感谢您的帮助!我已经阅读了定义,但它们在我的脑海中大喊大叫。
最佳答案
log
只需取向量每个元素的对数(默认以 e
为底)。
使用默认设置的 scale
将计算整个向量的平均值和标准差,然后通过减去平均值并除以标准差来按这些值“缩放”每个元素。 (如果您使用scale(x,scale=FALSE)
,它只会减去平均值,但不会除以标准偏差。)
请注意,这将为您提供相同的值
set.seed(1)
x <- runif(7)
# Manually scaling
(x - mean(x)) / sd(x)
scale(x)
关于r - 了解 R 中的 `scale`,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20256028/