我希望用适当的外推法来填充 NaN 值。我认为曲线拟合方法不太合适,因为我不知道给定点的曲线方程。我从 MPU 获得这些值。谁能建议我使用 Python 推断值以填充 NaN 位置的最佳方法?
mean_acc timestamp x_acc x_gyro y_acc y_gyro z_acc z_gyro
1.00 1143 0.96 -1.22 0.16 2.81 0.24 0.24
1.17 1646 1.15 -7.26 0.14 4.88 0.18 -0.06
1.02 2149 1.00 8.36 0.15 11.78 0.12 3.11
0.98 2652 0.96 -8.30 0.15 2.01 0.11 -2.01
1.05 3155 0.94 -4.21 0.17 3.42 0.42 -2.93
1.01 3658 1.00 2.75 0.12 4.64 0.05 5.13
NaN 4161 NaN NaN NaN NaN NaN NaN
NaN 4664 NaN NaN NaN NaN NaN NaN
NaN 5167 NaN NaN NaN NaN NaN NaN
NaN 5670 NaN NaN NaN NaN NaN NaN
最佳答案
通过阅读您的问题,我对您真正想要的答案感到困惑 -
- 不同的推断方法或
- 如何使用特定的外推方法将 NA 值填充到列中。
但是我会尝试回答这两个问题。
mean_acc、x_acc、y_acc、z_acc 空值可以用其平均值填充。 对于 y_gyro,将现有的转换为对数变换,然后外推对数值的平均值,然后反转对数变换以获得所需的值。
尝试绘制剩余字段并尝试找到可用于推断剩余列中 NULL 值的关系。
推断 pandas 中的空值。
X['mean_acc'].fillna(X['mean_acc'].mean(), inplace=True)
关于python - 如何使用 Python 推断给定数据来填充 NaN 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50829494/