我有一个数据集,其中包含像这样的数字和分类数据
subject_id hour_measure heart rate blood_pressure urine color
3 4 60
4 2 70 60 red
6 1 30 yellow
我尝试了各种方法来处理丢失的数据,例如下面的代码
f = lambda x: x.mean() if np.issubdtype(x.dtype, np.number) else next(iter(x.mode()), None)
df[cols] = df[cols].fillna(df[cols].transform(f))
df= df.fillna(method='ffill')
但是这些技术并没有给我我想要的结果。我尝试使用热甲板插补我已经了解热甲板插补技术的概念,因为它是处理数字和分类数据的合适方法。
最佳答案
如果您使用数据作为机器学习的输入,则可以将包含文本的列转换为数字(例如 LUT),或将颜色转换为相应的 RGB 值。
关于问题的第二部分:您能否更具体地说明您期望的结果以及当前代码产生的结果?
关于python - 在Python中实现热甲板插补,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59208733/