r - 如何通过对 R 中的条目进行分组来创建时间序列?

标签 r count group-by time-series

我想在 R 中创建从 2004 年 1 月 1 日到 2010 年 12 月 31 日的每日死亡率数据的时间序列。我现在拥有的原始数据(.csv 文件)列为日 - 月 - 年每一行都是一个死亡案例。因此,如果某一天的死亡率等于四,则该日期有四行。如果在特定日期没有报告死亡病例,则该日期在数据集中被忽略。

我需要的是一个包含 2557 行的时间序列(从 01/01/2004 到 31/12/2010),其中列出了每天的死亡病例总数。如果某一天没有死亡病例,我仍然需要那一天在列表中,并为其分配“0”。

有人知道怎么做吗?

谢谢, 戈西亚

原始数据示例:

day month   year
1   1   2004
3   1   2004
3   1   2004
3   1   2004
6   1   2004
7   1   2004

我需要什么:

day month   year    deaths
1   1   2004    1
2   1   2004    0
3   1   2004    3
4   1   2004    0
5   1   2004    0
6   1   2004    1

最佳答案

df <- read.table(text="day month   year
1   1   2004
3   1   2004
3   1   2004
3   1   2004
6   1   2004
7   1   2004",header=TRUE)

#transform to dates
dates <- as.Date(with(df,paste(year,month,day,sep="-")))

#contingency table
tab <- as.data.frame(table(dates))
names(tab)[2] <- "deaths"
tab$dates <- as.Date(tab$dates)

#sequence of dates
res <- data.frame(dates=seq(from=min(dates),to=max(dates),by="1 day"))
#merge
res <- merge(res,tab,by="dates",all.x=TRUE)
res[is.na(res$deaths),"deaths"] <- 0
res
#       dates deaths
#1 2004-01-01      1
#2 2004-01-02      0
#3 2004-01-03      3
#4 2004-01-04      0
#5 2004-01-05      0
#6 2004-01-06      1
#7 2004-01-07      1

关于r - 如何通过对 R 中的条目进行分组来创建时间序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15275219/

相关文章:

Rstudio 编辑器片段

linux - 在 ubuntu 上安装以前版本的 R 时出错

C 数字母函数

python - 在不安装 graphlab 的情况下在 SFrame 中分组

python - 如何旋转数据框

r - 如何从 R 中的 nls 模型中检索原始数据?

r - 在 r 的 S 形曲线上找到一个点

mysql - 在同一列中按条件计数

SQL 计数(*) 性能

mysql - 嵌套 CONCAT 中的 LEFT JOIN 和 IS NULL 仅返回 NULL