python - 在Python中实现热甲板插补

标签 python python-3.x pandas scikit-learn

我有一个数据集，其中包含像这样的数字和分类数据

subject_id   hour_measure   heart rate      blood_pressure       urine color
3               4                60              
4               2                70          60                   red 
6               1                            30                  yellow

我尝试了各种方法来处理丢失的数据，例如下面的代码

f = lambda x: x.mean() if np.issubdtype(x.dtype, np.number) else next(iter(x.mode()), None)
df[cols] = df[cols].fillna(df[cols].transform(f))
df= df.fillna(method='ffill')

但是这些技术并没有给我我想要的结果。我尝试使用热甲板插补我已经了解热甲板插补技术的概念，因为它是处理数字和分类数据的合适方法。

最佳答案

如果您使用数据作为机器学习的输入，则可以将包含文本的列转换为数字(例如 LUT)，或将颜色转换为相应的 RGB 值。

关于问题的第二部分:您能否更具体地说明您期望的结果以及当前代码产生的结果？

关于python - 在Python中实现热甲板插补，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59208733/

上一篇：python - 创建新列表并附加到字典

下一篇：python - Mask-RCNN/TensorFlow :Will different image formats (jpg, png)影响Mask-RCNN的训练结果？

相关文章：

Python 3.x for 循环和列表索引

python - ImportError : cannot import name 'sysconfig' from 'distutils' (/usr/lib/python3. 8/distutils/__ init__.py)

python - Pandas 合并删除重复行

python - 从 python 项目生成可执行文件

python - 使用 Python click 调用另一个子命令似乎无法验证字段

python - 如何检查一行中的所有列是否都是正数？

python - pandas Reindexing 仅对具有唯一值的 Index 对象有效

pandas - 使 Pandas 在除以零而不是 inf 时提高

python - 运行 __main__.py 时，获取当前模块

python - 在 Python 中进行法语文本分析的最佳方法是什么？