这几天我正在学习机器学习类(class)。我发现示例输入数据是这样的(例如,恶性肿瘤分类):
/ size gender classification
m1 100 male malignant
m2 50 female benign
所有这些数据可以放入一个 m * n 矩阵,其中 m 是样本数,n 是特征数。
如果输入数据不是行列的形式怎么办?例如,我想通过客户的订单历史来预测他是否是恶意的。输入数据的形式为:
我有多个客户:
[c1, c2, c3]
一个客户有多个订单:
[o1, o2, o3]
每个订单都有属性:
[orderDate, itemName. itemType, isPayed]
所以我想我无法将这些数据放入矩阵中。在程序代码中,它应该是一个三维数组。
如何处理此类数据?
最佳答案
也许您可以为每个订单使用不同的型号。如果客户基于该订单没有恶意,则每个人都应输出 0,否则应输出 1。然后,使用多数投票来获得结果。
关于machine-learning - 机器学习中如何处理超过二维的输入数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46093711/