machine-learning - 使用 One Hot 编码时的逻辑回归方程

标签 machine-learning linear-regression logistic-regression

当特征是数字时,如下所示:

enter image description here

假设sigmoid(transpose(theta).X))中的特征矩阵X将是:

enter image description here

但是,当我们这里还有 1 个功能时 - 颜色(可以是红色、蓝色或绿色),在进行一次热编码时,每个功能都将是一个向量,例如:[1 0 0 ] [0 1 0][0 0 1]

我无法弄清楚如何将这些One Hot Encoding向量合并到现有的特征矩阵中,然后在假设方程中使用它

最佳答案

是的,您应该从数据集中删除所有未编码的分类特征,对它们进行编码并从一种热编码中添加它们的编码值,当然您还必须将相应的权重添加到 theta 中。然后您可以在这个新数据集上拟合您的新模型

关于machine-learning - 使用 One Hot 编码时的逻辑回归方程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33646105/

相关文章:

R rlm 模型错误 : 'x' is singular: singular fits are not implemented in 'rlm'

machine-learning - 将多类模型的类概率转换为 0-100 范围内的分数

apache-spark - spark任务大小太大

r - NNet简单建模

python - Tensorflow 2 图像批量预测返回结果

nlp - 我们什么时候从文本中提取动词短语?

machine-learning - 较小的参数值如何有助于防止过度拟合?

r - 使用因子和数字预测变量执行套索正则化?

python - 如何在 tensorflow 中实现多元线性随机梯度下降算法?

machine-learning - 根据两个参数预测值