我在 CSV 文件中有一个数据集。我搜索了最有效的插补技术,发现大多数研究人员建议期望最大化或热甲板插补,但我未能使用 python 和其他技术(如统计)实现它们分类列的函数和值计数没有给我带来好的结果。 任何人都知道如何使用 python 实现这些技术
最佳答案
期望最大化或 EM 是使用两个步骤达到目标的算法的总称。期望阶段 - 计算某种形式的增益或误差,最大化阶段旨在最大化增益或最小化误差。 kMeans 聚类就是其中之一 - 期望阶段计算每个聚类的中心,最大化阶段将点分配到最近的聚类中心。通过插补,你可以看一下this link它描述了 python 的 EM 函数。
关于python - 搜索可用于期望最大化(EM)算法的 python 源代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59271935/