我正在尝试创建一个用于训练目的的假数据集,并且想要一个函数来创建与特定概率分布匹配的日期向量......即 - 应该选择比另一个范围更多的特定范围内的日期。
我知道要选择日期范围,我可以这样做:
seq(as.Date("1940-12-30"), as.Date("2005-01-04"), by="days")
要分配给总体,我可以这样做:
dchisq(x=1:500,df = 100)
或rlnorm(500,1,.6)
但我对如何制作seq()
一无所知。从上述特定概率分布之一中得出。那么如何根据模式绘制日期呢?
最佳答案
如果您可以描述每个日期所需的概率,则可以使用示例来完成此操作。下面是一个使用以年中为中心的高斯分布从 2005 年开始采样的示例。
Y05 = seq(as.Date("2005-01-01"), as.Date("2005-12-31"), by="days")
Prob = dnorm((1:365)*4/365 - 2)
sample(Y05, 10, replace=TRUE, prob=Prob)
关于r - 创建遵循概率分布的日期向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40836512/