python - 分类为两组之一(无需学习)

标签 python machine-learning cluster-analysis

我正在处理一个问题，我想自动将一个集合分为两个子集，因为我知道集合 A 中的几乎所有对象在所有维度上的值都比集合 B 中的对象大。

我知道我可以使用机器学习，但我需要它完全自动化，因为在问题实例中，集合 A 和集合 B 的对象将具有不同的值(因此问题实例 2 的集合 B 中的值可能是大于问题实例 1 的集合 A 中的值!)。

enter image description here

我想解决方案可能是找到最能代表这两组的对象(它们周围的对象的密度是最高的)。找到两组的 N 个最佳代表对我来说就足够了。

有人知道问题的名称和/或可以提出解决方案吗？ (Python 更佳)。

干杯!

最佳答案

你可以尝试一些聚类方法，属于无监督机器学习。结果取决于您的数据及其分布方式。根据你的图片我认为K-means算法可以工作。有一个用于机器学习的 python 库 scikit-learn，它已经包含 k-means 实现:http://scikit-learn.org/stable/modules/clustering.html#k-means

关于python - 分类为两组之一(无需学习)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24181001/

上一篇：python - 使用 for 循环将字母连接到字符串

下一篇：python - os.close(0) 和 sys.stdin.close() 的区别

python-3.x - 使用朴素贝叶斯分类器 Python 进行文本分类获得相同的输出

python - 使用 scikit-learn 的顺序 k-means 聚类

c++ - vector 量化中的马哈拉诺比斯距离与欧氏距离

python - python-requests 可以像 curl 一样直接获取 url 到磁盘上的文件句柄吗？

python - Gmail 不显示内联图片

machine-learning - 批量大小会导致错误的预测吗？

python - 在 Web2py 中访问安装在 Pythonanywhere 上的模块

python - 当缺少季度时如何确定 pandas 数据帧的季度行值的差异

r - 在 R 中将数据结构绘制为树