我正在处理一个数据文件,里面的观察结果是随机值。在这种情况下,我不知道 x 的分布(我的观察)。我使用函数密度来估计密度,因为我必须应用核估计。
T=density(datafile[,1],bw=sj,kernel="epanechnikov")
在此之后,我必须整合它,因为我正在寻找一个分位数(类似于 VaR,95%)。
为此,我有 2 个选择:
ecdf()
quantile()
现在我有了分位数 95 的值,但这是内核估计的数据。
有没有一个函数可以用来知道原始数据的分位数 95 的值?
我注意到这是一个未知的分布,为此我想将一种非参数方法想象为牛顿,就像 SAS
solve()
中的方法一样。
最佳答案
您可以使用 quantile()
为了这。下面是一个使用随机数据的例子:
> data<-runif(1000)
> q<-quantile(data, .95)
> q
95%
0.9450324
此处,数据均匀分布在 0 和 1 之间,因此第 95 个百分位数接近 0.95。
要执行逆变换:
> ecdf(data)(q)
[1] 0.95
关于r - 未知累积函数的反函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14446569/