python - 如何在 scipy-cluster 中的每个簇中选择最接近中心的代表?

标签 python cluster-analysis hierarchical-data hierarchical-clustering

基本上,我使用 Python 模块 scipy-cluster绘制大量数据点。如果给定阈值或我想要的代表数量,是否有方法/函数可以给出每个集群的代表?理想情况下,每个代表必须与其所属的簇中心有最近的距离。

编辑:我正在寻找最接近每个簇中质心的数据点。

最佳答案

Scipy-cluster 提供每个质心的坐标并识别每个簇中的点。一旦你拥有了,我相信scipy.cluster.vq.py_vq将为您提供观测值和质心之间的距离。

关于python - 如何在 scipy-cluster 中的每个簇中选择最接近中心的代表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11093735/

相关文章:

python - 无法通过 `tail -F` 从 `stdin` 读取

java - 大数据集的短文本聚类 - 用户分析

python - Pandas MultiIndex 中的重采样

mysql - 层次结构、临时表插入自

sql - 将平面表解析为树的最有效/优雅的方法是什么?

python - 名称错误 : name 'install' is not defined when installing packages using pip

Python 客户端支持在 Amazon EMR 上运行 Hive

machine-learning - K-means可以降维吗?

python - 带字符串的函数

javascript - 网络中的社区/集群检测算法 - 用 javascript 实现?