我有一个事实数据,其中包含一组参数和一些与该参数对应的值。 例如:
Street Color Shape Value
--------------------------------------
Versky Blue Ball 10
Soll Green Square 5
...
现在我需要创建一个函数来获取一组参数 [Holl, Red, Circle] 并返回预测的“值”。
如果我的参数是数字,我可以使用“使用 k 最近邻进行分类”算法,但它们不是。
我可以使用哪种机器学习算法来解决这个任务?
最佳答案
请注意,最近邻是根据某个距离度量找到最近的邻居。虽然欧几里得或类似的度量确实被广泛使用,但任何距离度量都可以。
您可以使用 Hamming distance 的变体:
Let x[i] be the i'th feature of vector x
Let the number of features be n
d(x,y) = Sum { (x[i] == y[i] ? 0 : 1) | i from 0 to n }
以上是一个距离度量,它基本上是汉明距离的变体,其中每个特征都有其独特的字母表。
关于algorithm - 非数字参数的“使用 k 最近邻分类”,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23076954/