r - 用 NA 标记冗余行

标签 r

我有一个包含完整行和不完整行的 data.frame,例如:

dat <- data.frame(
  "one" = c(1, 1, 1, 3, NA),
  "two" = c(2, 2, NA, 4, 4),
  "three" = c(1, 1, NA, 5, 5),
  "four"  = c(2, NA, 2, 6, 6)
)

我想将包含 NA 的行标记为 TRUE,其中它们的值等于同一列中具有较少 NA 的行中的值,所以

dat$redundant <- c(FALSE, TRUE, TRUE, FALSE, TRUE)

本质上,我正在寻找 duplicated(dat, MARGIN = 1)NA 算作与任何当前值的匹配。这可能吗?

最佳答案

我们可以使用

library(dplyr)
library(tidyr)
dat %>% 
     fill(everything()) %>% 
     duplicated
 #[1] FALSE  TRUE  TRUE FALSE  TRUE

关于r - 用 NA 标记冗余行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63806865/

相关文章:

r - 离线 ggplot2 文档?

R:将 YouTube 视频持续时间格式化为适当的时间(秒)

regex - 提取字符向量中两个特定单词之间的所有单词

r - 将几何转换为 R 中的经度/纬度坐标

旋转分类树终端条形图轴 - R

r - 无法更改 Rmd 文档中的参数

r - 在 R 中使用正则表达式检测一类字符中的一个或两个重复字符

r - dplyr 的每小时总和,空时为零

r - 使用 R 中的传单库绘制跨越国际日期变更线的路线

java - 在 R (Ubuntu 16.04) 中安装 RWeka 的问题