我目前有大量数据将用于训练预测神经网络(美国主要机场的千兆字节天气数据)。我几乎每天都有数据,但有些机场的数据中存在缺失值。例如,机场在 1995 年之前可能不存在,因此在此之前我没有该特定位置的数据。此外,有些缺失了整年(可能跨越 1990 年至 2011 年,缺失 2003 年)。
我该如何使用这些缺失值进行训练而不误导我的神经网络?我虽然用 0 或 -1 填充空数据,但我觉得这会导致网络预测某些输出的这些值。
最佳答案
我不是专家,但这肯定取决于您拥有的神经网络的类型?
神经网络的全部意义在于它们可以处理丢失的信息等等。
不过我同意,用 1 和 0 设置空数据并不是一件好事。
也许您可以提供一些有关您的神经网络的信息?
关于dataset - 用于神经网络模型预测的数据的缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6090674/