optimization - 多类 Logistic 回归的学习曲线

标签 optimization machine-learning logistic-regression supervised-learning

我使用逻辑回归编写了一个多类分类器,该分类器使用一对多方法进行训练。我想绘制经过训练的分类器的学习曲线。

学习曲线应该按类别绘制,还是应该作为整个分类器的单个图?这有什么不同吗?

需要澄清的是,学习曲线是训练和交叉验证/测试集错误/成本与训练集大小的关系图。该图应该可以让您了解增加训练集大小是否可以提高性能。更一般地说,学习曲线可以让您确定您的算法是否存在偏差(拟合不足)或方差(过度拟合)问题。

有关我的代码的一些详细信息:

  • 分析 MNIST 手写数字图像
  • 预测图像中的数字 (0-9)
  • 基于 Andrew Ng 的 Coursera 机器学习类(class)

最佳答案

一般来说,我会绘制所有的东西。或者编写一个脚本来收集所有内容并绘制所有内容。

我认为对整个分类器图的需求是显而易见的。但我觉得逐个类(class)的类(class)很有值(value),可以确保您不会在单个类(class)中遇到问题。比如说,如果“5”顽固地抵制增加的训练数据,但整体分类器仍然受到它的帮助,那么我宁愿在注入(inject)更多数据之前调查该类的情况。

关于optimization - 多类 Logistic 回归的学习曲线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30550344/

相关文章:

r - r-如何让polr正常失败

python - NumPy 日志函数抛出 int 属性错误

matlab - 在 Octave 中保存/加载大型矩阵

python - 使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数

machine-learning - 神经网络反向传播中,如何得到微分方程?

machine-learning - input_shape keras 中的 2D 卷积层

python - key 错误 : 'SPARK_HOME' in pyspark

c - 这个 gcc/clang 过去一个指针比较行为是否符合标准或非标准?

python - 使用 zip 或列表理解在 python 中创建字典是否更有效?

r - 将 R 中的 2 个预测概率图与 SjPlot 包结合起来