algorithm - 聚类算法——应用于一组地震数据

标签 algorithm cluster-analysis

所以我希望将聚类算法应用于 usgs 提供的地球数据。

http://earthquake.usgs.gov/earthquakes/feed/

我的主要目标是根据地震反馈确定前 10 个最危险的地方(根据地震次数或某个地方经历的地震强度)。

有没有关于如何做的建议?我正在查看 k-means,然后只计算 k-means 的总和(每个地震震级在每个集群中加权)来查看最危险的集群。

我也在用 ruby​​ 编写它作为代码引用。

谢谢

最佳答案

K-means 不能很好地处理数据集中的异常值。

此外,它是围绕方差设计的,但纬度和经度的方差并没有真正意义。事实上,k-means 无法处理纬度 +-180° 环绕。相反,您需要使用大圆距离

因此,请尝试使用基于密度 的聚类算法,该算法允许您使用诸如大圆距离之类的距离!

阅读维基百科和一本关于聚类分析的好书。

关于algorithm - 聚类算法——应用于一组地震数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15083842/

相关文章:

python - 在 Python 中聚类文本

python - 对现有项目列表进行排序以比较聚类解决方案

r - 如何翻转pheatmap中的层次聚类节点

machine-learning - 是否可以使用具有余弦相似度的 KDTree?

java - 在 mapreduce 中随机播放大数据文件

algorithm - 计算二维网格中的帧数

algorithm - 排序和负载均衡

python - 使用决策树比较 scikit 学习聚类

algorithm - 在matlab中查找所有可能的排列/组合以等于特定的和

algorithm - 反转 sprintf/format 的方法