java - 使用大型地理数据集在 ELKI 上运行 OPTICS 集群

标签 java cluster-analysis data-mining elki

我在 ELKI 上使用 OPTICSXi 和 rstartree 对地理数据集(纬度和经度)Gowalla 进行聚类,其中包含大约 600 万条记录,但 MiniGUI 总是显示“java 堆空间”和“错误:内存不足”。

我曾经看到Anony Mousse的一个回答,11分钟处理了120万个位置数据,使用ELKI上的OPTICSXi。我很困惑。为什么 ELKI 报告这些错误?

java平台或者ELKI上需要修改什么参数吗?

enter image description here

最佳答案

这是一个标准的内存不足错误。

您将必须添加更多内存,或以某种方式减少内存消耗。

您还可以尝试覆盖树(它需要比当前 R* 树实现少得多的内存)。确保使用适当且较小的 epsilon 值,以便从索引中受益。

关于java - 使用大型地理数据集在 ELKI 上运行 OPTICS 集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33493061/

相关文章:

machine-learning - SAS Enterprise Miner - 集群节点 - 可以将坐标矩阵作为输入吗?

r - PAM 聚类 - 使用另一个数据集中的结果

java - 抑制 GUI?

c - 如何检查一个点是否在点簇内

java - 无法迭代列表

algorithm - DBSCAN 与 OPTICS 的自动聚类

r - 如何将单词添加到语料库中的文档中?

r - 机器学习中的评估指标

java - 删除特定字符后的下一个字母?

java - 空白 "Location" header ,但在 IE 中发生重定向