r - 如何在 R 或 Matlab 中将这个不规则间隔的时间序列转换(插值)为规则间隔的时间序列?

标签 r time-series forecasting matlab interpolation

我有以下数据:

Lines = "20/03/2014,9996792524
21/04/2014,8479115468
21/09/2014,11394750532
16/10/2014,9594869828
18/11/2014,10850291677
08/12/2014,10475635302
22/01/2015,10116010939
26/02/2015,11206949341
20/03/2015,11975140317
09/04/2015,11526960332
29/04/2015,9986194500
16/09/2015,11501088256
13/10/2015,11833183163
10/11/2015,13246940910
16/12/2015,13255698568
27/01/2016,13775653990
23/02/2016,13567323648
22/03/2016,14607415705
11/04/2016,13835444224
04/04/2016,14118970743"

我将其读入 R:

z <- read.zoo(text = Lines, sep = ",", header = TRUE, index = 1:1, tz = "", format = "%d/%m/%Y")

我希望对数据进行插值,以便将这个间隔不规则的时间序列转换为常规时间序列。时间间隔只要有规律即可,但每月、每周或每两周一次都可以。

如何在 RMatlab 中执行此操作?

注意:我意识到内插值可能不是很准确并且可能会歪曲信息,但是我需要学习如何做到这一点并且我可以接受失去一些准确性。

最佳答案

好的,首先,警告一句:如果你要插值然后执行测试或一般统计估计,你的结果将(严重)有偏差,除非你有一些充分的理由(领域知识?)假设您的插值方法将生成来自原始点的相同分布的点。不,“情节看起来不错”不是评估这个的好标准:) 话虽如此,让我们来看看数据:

# Lines contains your data
library(zoo)
fmt <- "%d/%m/%Y" 
z <- read.zoo(text = Lines, sep = ",", header = TRUE, index = 1:1, tz = "", format = fmt)
t <- time(z)
plot(z,type="p",xaxt="n",pch=19,col="cyan",cex=1.5)
labs <- format(t,fmt)
axis(side = 1, at = t, labels = labs,cex.axis = 0.7)    

enter image description here

看起来您丢失的大部分数据都与 2014 年夏季和 2015 年夏季有关。我很想知道这些数据是什么...无论如何,看起来您的大部分数据至少间隔了 2 周:

diff(t)
# Time differences in days
# [1] 153  25  33  20  45  35  22  20  20 140  27  28  36  42  27  28  13   7

因此,让我们通过首先创建一个虚拟 zoo 对象来插入每两周一次的系列:

t.biweekly <- seq(from = min(t), to=max(t),by="2 weeks")
dummy <- zoo(,t.biweekly)

将虚拟系列与您的系列合并:

z.interpolated <- merge(z,dummy,all=TRUE)

如果您查看新系列,您会发现 dummy 的所有时间都有 NA 值,而在 z 中没有相应的时间。让我们用线性插值填充这些点并查看结果:

z.interpolated <- na.approx(z.interpolated)
plot(z.interpolated, type = "b")
points(z,pch=19,col="cyan",cex=1.5)

enter image description here

瞧!请记住,从这个东西中构建推理模型是一个坏主意......

关于r - 如何在 R 或 Matlab 中将这个不规则间隔的时间序列转换(插值)为规则间隔的时间序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38723185/

相关文章:

r - 有没有办法在使用 R 的 flextable 包时将传递给 add_header_lines() 的字符串的一部分加粗

python - 修改时间序列数据中传感器故障引起的异常值

python - ValueError : could not convert string to float - sns. tsplot,时间 - 使用字符串来标记 x 轴

r - R中的时间序列分析

excel - excel中的预测函数FORECAST.ETS不起作用

azure - 为了从 Azure AutoML 时间序列预测中获得此结果,我可能做错了什么?

r - 如何将稀疏矩阵中的替换值设置为 NA 而不是 0?

r - sqldf 和 POSIXct

python - 如何绘制时间序列中事件的频率?

r - 使 rbind 循环更快