python - 如何使用 Python 推断给定数据来填充 NaN 值?

标签 python pandas machine-learning dataset nan

我希望用适当的外推法来填充 NaN 值。我认为曲线拟合方法不太合适,因为我不知道给定点的曲线方程。我从 MPU 获得这些值。谁能建议我使用 Python 推断值以填充 NaN 位置的最佳方法?

mean_acc  timestamp     x_acc   x_gyro  y_acc   y_gyro  z_acc   z_gyro

  1.00     1143            0.96     -1.22     0.16     2.81  0.24  0.24

  1.17    1646             1.15     -7.26   0.14    4.88    0.18    -0.06

  1.02     2149            1.00     8.36    0.15    11.78   0.12    3.11

   0.98     2652           0.96     -8.30   0.15    2.01    0.11    -2.01

   1.05     3155           0.94     -4.21   0.17    3.42    0.42    -2.93

   1.01     3658           1.00     2.75    0.12    4.64    0.05    5.13

    NaN     4161            NaN     NaN     NaN     NaN     NaN     NaN

    NaN     4664            NaN     NaN     NaN     NaN     NaN     NaN

    NaN     5167             NaN    NaN     NaN     NaN     NaN     NaN

    NaN     5670             NaN    NaN     NaN     NaN     NaN     NaN

最佳答案

通过阅读您的问题,我对您真正想要的答案感到困惑 -

  1. 不同的推断方法或
  2. 如何使用特定的外推方法将 NA 值填充到列中。

但是我会尝试回答这两个问题。

mean_acc、x_acc、y_acc、z_acc 空值可以用其平均值填充。 对于 y_gyro,将现有的转换为对数变换,然后外推对数值的平均值,然后反转对数变换以获得所需的值。

尝试绘制剩余字段并尝试找到可用于推断剩余列中 NULL 值的关系。

  • 推断 pandas 中的空值。

    X['mean_acc'].fillna(X['mean_acc'].mean(), inplace=True)

  • 关于python - 如何使用 Python 推断给定数据来填充 NaN 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50829494/

    相关文章:

    machine-learning - 使用 AutoML 识别准确性和丢弃的特征 (ml.net)

    文本分类/机器学习 : do I also need a 'Default' categorie?

    python - 在 Python 3.6.1 中使用带有 basemap 和轮廓的某些投影时出现 IndexError

    python - 将图像从 8 位转换为 10 位的问题

    python - pandas 可以通过使用 pandas 和 Python 2.7 选择一些数据或所有数据特定列并平均每 5 行吗?

    python - 更快地检查 csv 中的值的方法?

    python - 使用 scikit 限制线性回归预测值

    python - 这段代码 Python 3.3 有什么问题

    datetime - 在numpy(python)中将日期时间字符串转换为日期时间

    opencv - 给定一张人脸的几帧不一定都是正面的,如何构建人脸识别模型?