r - 用 NA 标记冗余行

标签 r

我有一个包含完整行和不完整行的 data.frame，例如:

dat <- data.frame(
  "one" = c(1, 1, 1, 3, NA),
  "two" = c(2, 2, NA, 4, 4),
  "three" = c(1, 1, NA, 5, 5),
  "four"  = c(2, NA, 2, 6, 6)
)

我想将包含 NA 的行标记为 TRUE，其中它们的值等于同一列中具有较少 NA 的行中的值，所以

dat$redundant <- c(FALSE, TRUE, TRUE, FALSE, TRUE)

本质上，我正在寻找 duplicated(dat, MARGIN = 1) 但 NA 算作与任何当前值的匹配。这可能吗？

最佳答案

我们可以使用

library(dplyr)
library(tidyr)
dat %>% 
     fill(everything()) %>% 
     duplicated
 #[1] FALSE  TRUE  TRUE FALSE  TRUE

关于r - 用 NA 标记冗余行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63806865/

相关文章：

r - 离线 ggplot2 文档？