python - 使用 PyMC3 预测贝叶斯线性回归中新数据的后验

标签 python linear-regression bayesian pymc pymc3

使用 PyMC3 执行贝叶斯线性回归。我构建了模型,并且想使用相同的模型来预测新 X 值的后验。我一直在尝试按照文档网站上的说明进行操作:https://pymc-devs.github.io/pymc3/notebooks/posterior_predictive.html (参见预测)。这包括在分析之前将 X 值设置为 theano 共享变量,然后在模型构建后更改值并运行 run_ppc()。作为示例,我快速运行了 200 次迭代(为了实际分析,我会运行更多迭代)。

X1_shared = theano.shared(final_df['poll_diff'].values)
Y1 = final_df['rd_diff'].values

basic_model = pm.Model()
with basic_model:

    # Priors for unknown model parameters
    sigma = HalfCauchy('sigma', beta=10, testval=1.)
    intercept = Normal('Intercept', 0, sd=20)
    x_coeff = Normal('x', 0, sd=20)

    # Define likelihood
    likelihood = Normal('y', mu=intercept + x_coeff * X1_shared,
                        sd=sigma, observed= Y1)

    #start = find_MAP()
    start = find_MAP() # Find starting value by optimization
    step = NUTS(scaling=start) # Instantiate MCMC sampling algorithm
    trace = sample(200, step, start=start)
pm.traceplot(trace)
plt.show()

enter image description here

sns.lmplot(x="poll_diff", y="rd_diff", data=final_df, size=10)
x = np.array(range(-1, 2))
pm.glm.plot_posterior_predictive(trace, samples=100, eval=x)
plt.show()

enter image description here

X1_shared.set_value(ana_2016_df['poll_diff'].values)
ppc = pm.sample_ppc(trace, model=model, samples=100)

但是我收到以下错误:

AttributeError                            Traceback (most recent call last)
<ipython-input-73-9c1eb48d987f> in <module>()
----> 1 ppc = pm.sample_ppc(trace, model=model, samples=100)

C:\Users\W\Anaconda3\lib\site-packages\pymc3\sampling.py in sample_ppc(trace, samples, model, vars, size, random_seed)
    349 
    350     if vars is None:
--> 351         vars = model.observed_RVs
    352 
    353     seed(random_seed)

AttributeError: module 'pymc3.model' has no attribute 'observed_RVs'

值得注意的是,如果我使用 patsy 表示法版本,而不更改变量,则不会弹出此错误,但我不知道 patsy 格式如何接受 theano 共享变量。因此,解决方案要么解决我的错误消息,要么展示如何将 theano 共享变量引入到模型的 patsy 版本中。谢谢!

最佳答案

正如 aloctavodia 指出的,这是设置变量时的一个简单错误。在 ppc = pm.sample_ppc(trace, model=model,samples=100) 中,model 应为 model = basic_model

关于python - 使用 PyMC3 预测贝叶斯线性回归中新数据的后验,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40775817/

相关文章:

python - Windows 7 上的 Kaggle API

python - IntegrityError :NOT NULL constraint failed: chatapp_chat. 消息

r - 使用具有线性回归模型的函数

python - 为什么看不到回归线?

Python 朴素贝叶斯将推文分类。方法

python - 字典中的总和键

python - Pygame 贪吃蛇游戏

R - 在 lm 中使用回归时如何获取底层矩阵?

machine-learning - 朴素贝叶斯分类器偏置输出?

bayesian - pymc3:具有多个观察变量的分层模型