当特征是数字时,如下所示:
假设sigmoid(transpose(theta).X))
中的特征矩阵X将是:
但是,当我们这里还有 1 个功能时 - 颜色(可以是红色、蓝色或绿色),在进行一次热编码时,每个功能都将是一个向量,例如:[1 0 0 ]
[0 1 0]
和 [0 0 1]
。
我无法弄清楚如何将这些One Hot Encoding向量合并到现有的特征矩阵中,然后在假设方程中使用它
最佳答案
是的,您应该从数据集中删除所有未编码的分类特征,对它们进行编码并从一种热编码中添加它们的编码值,当然您还必须将相应的权重添加到 theta 中。然后您可以在这个新数据集上拟合您的新模型
关于machine-learning - 使用 One Hot 编码时的逻辑回归方程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33646105/