某些程序各自具有特定的功能。还有一个特征向量,它是所有特征的并集。我对特征向量进行了建模,如下所示。
1 - 该特征存在于特征向量中
0 - 特征向量中不存在该特征。
我必须找到以下变体之间的关系
10001110
10110101
10010111
10101100
10011101
这里所有程序中的关系是 0,1 和 5 位置不会改变,即它们代表的特征倾向于继续。 给定一个大数据集,是否有任何机器学习/数据挖掘方法可以找到它们之间的关系。
最佳答案
您可以使用affinity analysis ,例如 market basket analysis 中使用的。
假设你的每个向量都是一个顾客结账的购物袋,每一列都是一个产品。然后市场篮分析会发现如下内容:
买牛奶+鸡蛋=>买黄油
大部分靠面包
对您的问题的应用似乎很自然。
关于machine-learning - 寻找变体之间的关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30764702/