我在 R 中操作数据帧时遇到问题。这是 R 中的基本内容,但我找不到执行此类操作的最佳命令。
虚拟示例
Var1 20 300 39
Var2 49 23 91
Var3 0 239 210
如何用
10
替换值如果值小于 10
,则在第 2 列中;或者如何用
100
替换数据框中的所有值,如果它们大于 200
?
最佳答案
您可以使用 apply
替换整个 data.frame 中大于例如 200 的所有值
apply(df, 2, function(x) ifelse(x > 200, 100, x))
注意:如果任何列不是数字,所有列都将转换为字符或因子。为避免这种情况,您可以执行以下操作。如果您有数据框
df
有两个数字列,第 1 列和第 2 列,您要对其进行操作,以及两个非数字列,您不想对其进行操作,您可以这样做:df <- cbind(apply(df[,1:2], 2, function(x) ifelse(x > 200, 100, x)), df[,3:4])
在@GregSnow 发表评论后编辑:
使用
lapply
可能更有用在这种情况下。df[] <- lapply(df, function(x) ifelse(x>200, 100, x))
对于以前不知道的人(包括我自己),请使用
df[]
而不仅仅是 df
df
的结构保持原样(感谢@GregSnow 提供有值(value)的信息)。
关于如果值更大或更小,则替换数据框中的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23833752/