我正在尝试从一个庞大的数据集中寻找 5000 个中心点。我的输入数组是 [5000000][512],意思是有很多 512 维的 vector 。 C++ 对数组大小有限制,我似乎无法克服这一点。我想使用 opencv kmeans 函数。 有什么想法吗???
最佳答案
同意上面的人。真正的问题是,你真的有这样一台内存这么大的笔记本电脑/台式机吗?如果答案是肯定的,您可以简单地编写 C 程序来完成这项工作。否则,您可能必须想出一个分布式解决方案,例如 Hadoop 上的 Mahout。另一种选择是,如果您的要求可以接受,您可能希望以某种方式从所有数据中提取样本,并对样本进行聚类。
关于c++ - 具有巨大数组的 Kmeans,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17850403/