machine-learning - 预测缺少预测器的新实例

标签 machine-learning prediction

我有一个(可能是愚蠢的)问题,关于预测缺少预测变量的新实例。

我得到了一个数据。假设我对数据进行了预处理、清理,结果,假设还剩下 10 个预测变量。然后,我根据结果数据训练模型,以便准备使用模型进行预测。

现在,如果我想预测一个缺少 1 或 2 个预测变量的新实例,我该怎么办?

最佳答案

至少有两个合理的解决方案。

(1) 以非缺失变量的值为条件,对缺失变量的可能值求平均输出。也就是说,计算每个可能的缺失值的输出预测(缺失、非缺失)的加权平均值,并按给定非缺失的缺失概率进行加权。这本质上是文献中所谓的“多重插补”的变体。

首先要尝试的是仅根据缺失的无条件分布进行加权。如果这看起来太复杂,一个非常粗略的近似是将缺失的平均值替换为预测。

(2) 为每个组合变量建立模型。如果有 n 个变量,这意味着构建 2^n 个变量。如果 n = 10,那么现在 1024 个模型并不是什么大问题。然后,如果您缺少一些变量,只需使用现有变量的模型即可。

顺便说一句,您可能会对 stats.stackexchange.com 上的这个问题更感兴趣。

关于machine-learning - 预测缺少预测器的新实例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46590972/

相关文章:

machine-learning - NEAT 和强化学习之间有什么关系?

search - 测量精确度和召回率

statistics - 基于PAC-learning框架的计算学习理论

machine-learning - 简单感知器模型和 XOR

python - 如何将用户输入转换为独立虚拟变量

python - 在训练和测试数据中保持相同的虚拟变量

python - 如何使用 scipy 的 curve_fit 对线性回归进行正则化?

python - 卡尔曼滤波器总是预测原点

deployment - 保存经过训练的 Detectron2 模型并对单个图像进行预测

tensorflow - 如何保存和恢复 Keras LSTM 模型?