我有许多包含 0 和 1 列的数据帧 (96)。如果数据帧的任何一列中有多个“1”,我想用相等的分数替换 1,以便该列中的值的总和为 1,如下面的代码所示。
v1 <- c(0, 1, 0, 1, 1, 0)
v2 <- c(0, 0, 1, 0, 0, 0)
v3 <- c(0, 0, 1, 1, 0, 0)
df1 <- data.frame(v1, v2, v3)
df2 <-data.frame(v3, v3, v1)
df3 <- data.frame(v1, v3, v1)
new.df1 <- t(apply(df1, 2, FUN = function(x) {
if(sum(x==1, na.rm=TRUE) ==2) replace(x, x==1, 0.5)
else if (sum(x==1, na.rm=TRUE)==3) replace( x, x==1, 1/3)
else x}))
new.df2 <- t(apply(df2, 2, FUN = function(x) {
if(sum(x==1, na.rm=TRUE) ==2) replace(x, x==1, 0.5)
else if (sum(x==1, na.rm=TRUE)==3) replace( x, x==1, 1/3)
else x}))
new.df3 <- t(apply(df3, 2, FUN = function(x) {
if(sum(x==1, na.rm=TRUE) ==2) replace(x, x==1, 0.5)
else if (sum(x==1, na.rm=TRUE)==3) replace( x, x==1, 1/3)
else x}))
我可以像上面的例子一样用蛮力创建我想要的东西,但是必须有更好(更简洁)的方法。我非常感谢一些帮助。
最佳答案
与其他答案类似,但更加模块化,并且是函数的改进版本:
## Put your data frames in a list
# df_list = list(df1, df2, df3)
df_list = mget(ls(pattern = "df[0-9]"))
## Write a function to modify one column
replace_ones = function(x) {
sx = sum(x == 1, na.rm = TRUE)
if(sx > 1) {
x = replace(x, x == 1, 1 / sx)
}
return(x)
}
## Wrap it to modify a data frame:
replace_ones_df = function(df) {
df[] = lapply(df, replace_ones)
return(df)
}
## Apply the function to all columns of all data frames:
result_list = lapply(df_list, replace_ones_df)
# $df1
# v1 v2 v3
# 1 0.0000000 0 0.0
# 2 0.3333333 0 0.0
# 3 0.0000000 1 0.5
# 4 0.3333333 0 0.5
# 5 0.3333333 0 0.0
# 6 0.0000000 0 0.0
#
# $df2
# v3 v3.1 v1
# 1 0.0 0.0 0.0000000
# 2 0.0 0.0 0.3333333
# 3 0.5 0.5 0.0000000
# 4 0.5 0.5 0.3333333
# 5 0.0 0.0 0.3333333
# 6 0.0 0.0 0.0000000
#
# $df3
# v1 v3 v1.1
# 1 0.0000000 0.0 0.0000000
# 2 0.3333333 0.0 0.3333333
# 3 0.0000000 0.5 0.0000000
# 4 0.3333333 0.5 0.3333333
# 5 0.3333333 0.0 0.3333333
# 6 0.0000000 0.0 0.0000000
关于r - 如何在r中的许多数据帧中的列上循环函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56854622/