algorithm - 非数字参数的“使用 k 最近邻分类”

标签 algorithm machine-learning

我有一个事实数据,其中包含一组参数和一些与该参数对应的值。 例如:

Street     Color     Shape      Value
-------------------------------------- 
Versky     Blue      Ball         10
Soll       Green     Square       5
...

现在我需要创建一个函数来获取一组参数 [Holl, Red, Circle] 并返回预测的“值”。

如果我的参数是数字,我可以使用“使用 k 最近邻进行分类”算法,但它们不是。

我可以使用哪种机器学习算法来解决这个任务?

最佳答案

请注意,最近邻是根据某个距离度量找到最近的邻居。虽然欧几里得或类似的度量确实被广泛使用,但任何距离度量都可以。

您可以使用 Hamming distance 的变体:

Let x[i] be the i'th feature of vector x
Let the number of features be n

    d(x,y) = Sum { (x[i] == y[i] ? 0 : 1) | i from 0 to n }

以上是一个距离度量,它基本上是汉明距离的变体,其中每个特征都有其独特的字母表。

关于algorithm - 非数字参数的“使用 k 最近邻分类”,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23076954/

相关文章:

algorithm - 用平面向量表示的网格扫描(遍历)

algorithm - 在大量 URL 中检测重复网页

algorithm - 相交 n 条线段(在整数网格上)

java - 将线分割(分割)成任意长度的段。 (开始时短,结束时宽)

python - 用于圆检测的最小二乘法

algorithm - 分离和模式匹配技术

python - 在复杂模型上使用 Pytorch 进行修剪

python - "Bad argument (train data must be floating-point matrix)"错误

apache-spark - 在 Spark 的 MLlib 中使用的 TFIDF 生成期间出现内存不足异常

machine-learning - SVMlight 列车数据格式化