对数据集进行聚类,然后使用 sklearn.cluster.KMeans 将数据转换为距质心的距离后,是否可以在给定质心的情况下反转转换,恢复原始特征?
最佳答案
不,这是不可能的。一般来说,任何降维技术都是有损操作。如果您丢弃某些维度,则无法恢复此信息。 一般,即对于一些可能的数据集。可能存在一些数据集,其中某些信息是冗余的 - 如果特定的降维技术能够完美地利用这一点,那么完美的逆变换将是可能的。
下图中我画了一个简单的例子。您可以将 3D 空间中许多不同的点配置投影到 2D 空间中的相同点配置。因此,仅给出 2D 空间,无法猜测这些点来自哪个 3D 配置。您不知道它们的 z 坐标值,并且存在无限多种可能性。
关于python - sklearn中KMeans的变换是否可以逆转?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24248393/