R:确定每个日期间隔是否与数据框中的所有其他日期间隔重叠

标签 r dplyr lubridate

对于数据框中的每个日期间隔行,我想确定它是否与所有其他日期间隔重叠。排除自身。

具有开始和结束日期的数据框,表示间隔:

`data <- read.table(header=TRUE,text="
start.date             end.date
2019-09-01             2019-09-10
2019-09-05             2019-09-07
2019-08-25             2019-09-05
2019-10-10             2019-10-15
")`

此函数 lubridate::int_overlaps() 通过返回逻辑 TRUE 或 FALSE 检查两个日期间隔是否重叠。

`int_overlaps(interval(ymd("2019-09-01"),ymd("2019-09-10")), interval(ymd("2019-09-05"), ymd("2019-09-07")))
[1] TRUE
int_overlaps(interval(ymd("2019-09-01"),ymd("2019-09-10")), interval(ymd("2019-10-10"), ymd("2019-10-15")))
[1] FALSE`

我想使用 int_overlap() 将每个日期间隔与除自身之外的所有其他日期间隔进行迭代,以确定它是否与其他日期重叠。

输出应该是这样的:

`data <- read.table(header=TRUE,text="
start.date             end.date         overlaps
2019-09-01             2019-09-10       TRUE
2019-09-05             2019-09-07       TRUE
2019-08-25             2019-09-05       TRUE
2019-10-10             2019-10-15       FALSE
")
`

最佳答案

这是一个使用 dplyrpurrr 的选项,我们遍历 Int 的索引,将当前间隔与其他间隔进行比较。

library(dplyr)
library(purrr)
library(lubridate)
data %>% mutate(Int = interval(start.date, end.date), 
                overlaps = map(seq_along(Int), function(x){
                  #browser()
                  #Get all Int indexes other than the current one
                  y = setdiff(seq_along(Int), x)
                  #The interval overlaps with all other intervals
                  #return(all(int_overlaps(Int[x], Int[y])))
                  #The interval overlaps with any other intervals
                  return(any(int_overlaps(Int[x], Int[y])))
                }))

  start.date   end.date                            Int overlaps
1 2019-09-01 2019-09-10 2019-09-01 UTC--2019-09-10 UTC     TRUE
2 2019-09-05 2019-09-07 2019-09-05 UTC--2019-09-07 UTC     TRUE
3 2019-08-25 2019-09-05 2019-08-25 UTC--2019-09-05 UTC     TRUE
4 2019-10-10 2019-10-15 2019-10-10 UTC--2019-10-15 UTC    FALSE

关于R:确定每个日期间隔是否与数据框中的所有其他日期间隔重叠,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58283935/

相关文章:

R Hadoop映射器错误下标越界

r - 以编程方式重命名dplyr中的列

r - 使用 dplyr 实用程序将纯文本数据 reshape 为常规表格数据的任何方法?

r - 关于持续时间与周期如何在加月润滑中工作的混淆

R 润滑 : pretty_dates fails for some input data

r - cut 函数产生不均匀的初断

r - 更改 Shiny Action 按钮的形状

r - 以编程方式将列名传递给 data.table

R - dplyr bootstrap 几个变量

r - 在日期序列中查找月份的最后一天