machine-learning - 该数据集的逻辑回归和朴素贝叶斯

标签 machine-learning dataset data-mining classification logistic-regression

朴素贝叶斯和逻辑回归都能完美地对这两个数据集进行分类吗?我的理解是朴素贝叶斯可以,并且具有复杂项的逻辑回归可以对这些数据集进行分类。如果我错了,请帮忙。

数据集图像在这里:

enter image description here

最佳答案

让我们在两个与您发布的数据集相似的数据集上运行这两种算法,看看会发生什么......

编辑我之前发布的答案不正确。我忘记考虑高斯朴素贝叶斯的方差。 (之前的解决方案是使用具有固定恒等协方差的高斯函数的朴素贝叶斯,它给出了线性决策边界)。

事实证明,LR 在循环数据集上失败了,而 NB 可以成功。 两种方法都在矩形数据集上取得了成功。

LR 决策边界是线性的,而 NB 边界是二次的(具有不同协方差的两个轴对齐高斯之间的边界)。

应用 NB 圆形数据集给出了大致相同位置的两个均值,但具有不同的方差,从而导致大致圆形的决策边界 - 随着半径的增加,与较低方差相比,较高方差高斯的概率会增加高斯。在这种情况下,内圆上的许多内点被错误分类。

下面的两张图显示了具有固定方差的高斯 NB 解。

Circular Dataset (Identity covariance gaussian naive bayes)

Rectangular Dataset (Identity covariance gaussian naive bayes)

在下图中,等值线表示 NB 解的概率等值线。 该高斯 NB 解决方案还可以学习各个参数的方差,从而在解决方案中产生轴对齐的协方差。

Circular Dataset (Gaussian naive bayes - axis-aligned covariance)

Rectangular Dataset (Gaussian naive bayes - axis-aligned covariance)

关于machine-learning - 该数据集的逻辑回归和朴素贝叶斯,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21468469/

相关文章:

machine-learning - 我的问题属于机器学习或深度学习的哪一类?

dataset - 为 scikit-learn 准备数据

artificial-intelligence - 决策树剪枝的效果

java - 需要帮助选择数据挖掘/神经网络 API

machine-learning - Ml.NET - 基于某些属性预测部门

python - tensorflow 。将一列数组 (200,) 放入一列占位符 [无,1] 会产生形状错误

python - 摆脱 maxpooling 层会导致运行 cuda 内存错误 pytorch

algorithm - Dremel - 重复和清晰度级别

dataset - Google 代码之夏 : web classification dataset

html - 从 url 收集有关公司的一组描述性标签的最佳方法?