machine-learning - 预测缺少预测器的新实例

我有一个(可能是愚蠢的)问题，关于预测缺少预测变量的新实例。

我得到了一个数据。假设我对数据进行了预处理、清理，结果，假设还剩下 10 个预测变量。然后，我根据结果数据训练模型，以便准备使用模型进行预测。

现在，如果我想预测一个缺少 1 或 2 个预测变量的新实例，我该怎么办？

最佳答案

至少有两个合理的解决方案。

(1) 以非缺失变量的值为条件，对缺失变量的可能值求平均输出。也就是说，计算每个可能的缺失值的输出预测(缺失、非缺失)的加权平均值，并按给定非缺失的缺失概率进行加权。这本质上是文献中所谓的“多重插补”的变体。

首先要尝试的是仅根据缺失的无条件分布进行加权。如果这看起来太复杂，一个非常粗略的近似是将缺失的平均值替换为预测。

(2) 为每个组合变量建立模型。如果有 n 个变量，这意味着构建 2^n 个变量。如果 n = 10，那么现在 1024 个模型并不是什么大问题。然后，如果您缺少一些变量，只需使用现有变量的模型即可。

顺便说一句，您可能会对 stats.stackexchange.com 上的这个问题更感兴趣。

关于machine-learning - 预测缺少预测器的新实例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46590972/

相关文章：

machine-learning - NEAT 和强化学习之间有什么关系？