algorithm - 聚类算法——应用于一组地震数据

所以我希望将聚类算法应用于 usgs 提供的地球数据。

我的主要目标是根据地震反馈确定前 10 个最危险的地方(根据地震次数或某个地方经历的地震强度)。

有没有关于如何做的建议？我正在查看 k-means，然后只计算 k-means 的总和(每个地震震级在每个集群中加权)来查看最危险的集群。

我也在用 ruby 编写它作为代码引用。

谢谢

最佳答案

K-means 不能很好地处理数据集中的异常值。

此外，它是围绕方差设计的，但纬度和经度的方差并没有真正意义。事实上，k-means 无法处理纬度 +-180° 环绕。相反，您需要使用大圆距离。

因此，请尝试使用基于密度的聚类算法，该算法允许您使用诸如大圆距离之类的距离!

阅读维基百科和一本关于聚类分析的好书。

关于algorithm - 聚类算法——应用于一组地震数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15083842/

相关文章：

python - 在 Python 中聚类文本