machine-learning - 在 Scikit 中使用 K Mean 选择特征并恢复特征

我想在 Scikit 中进行一些 K 均值聚类。我有 9 个特征，但我只想在聚类中选择其中的四个，而且由于四个聚类中的每一个都是用不同的指标来衡量的，所以我想对要聚类的每四个特征进行标准化。但是，我想以原始形式列出每个数据及其各自的聚类点。我应该怎么办？

最佳答案

您始终可以使用原始数据点。

要么重新计算原始数据中的质心，要么应用逆归一化(z-归一化是可逆的!)；但这样您将只能获取您使用的四个属性的数据。

重新计算原始数据中的质心是微不足道的，并且还会为您提供有关其他属性的信息(如果您可以计算平均值，并且它们不是例如分类的；但是您可能想查看模式相反)

关于machine-learning - 在 Scikit 中使用 K Mean 选择特征并恢复特征，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26318877/

相关文章：

r - R中随机森林中的二元分类或未知类