machine-learning - 如何评估和分析机器学习算法性能?

抱歉,如果我的问题听起来太幼稚...我真的是机器学习和回归的新手
我最近以一名硕士生的身份加入了机器学习实验室。我的教授要我写一篇论文“实验分析”,实验室将要提交的关于他们开发的回归算法的论文。
问题是我不知道该怎么做,他说算法是稳定且完整的,他们已经写了论文的第一部分,我需要写评估部分。
我真的不知道该怎么办。我参与了算法的编码,并且我对它非常了解,但是我不知道为了评估和分析其性能我必须执行哪些任务。
-我从哪里获得数据?
-测试过程是什么?
-要进行什么分析?
我是研究和论文写作的新手,真的不知道该怎么办。
我最近读了很多论文,但是我没有分析ML算法的经验。
您能指导我并解释一下(新手级别)该过程吗?
详细的答案表示赞赏
谢谢

最佳答案

您将需要一个测试数据集来评估性能。如果你
没有,请划分您的训练数据集(您当前
将这个算法运用于训练集和交叉验证集
(不重叠)。

通过从中去除预测(y值)来创建测试集
交叉验证集。

使用训练数据集运行算法以训练模型。

训练完模型后,请使用剥离后的模型测试其性能
关闭“测试集”。

要评估性能,可以使用RMSE(均方根
错误)指标。您将需要使用以下预测:
为测试集中的每个样本及其样本制定的算法
相应的实际预测(您之前剥离的
输入测试集)。您可以找到更多信息here

本文翻译自 https://stackoverflow.com/questions/22469945/

网站遵循 CC BY-SA 4.0 协议,转载或引用请注明出处。

标签 machine-learning analysis evaluation


相关文章:

c# - 如何查找仅包含标题的商品属于哪个类别?

java - Java Portlets的优点和缺点?

javascript - 在JavaScript中的return语句后执行代码?

apache-spark - 如何选择平衡抽样进行二进制分类?

python - 教程中的RNN示例代码中的“变量权重已存在”

python - 从CSV获取熊猫系列

machine-learning - 分类编码之前或之后的标准化?

c++ - 在此给定算法中,什么才是“基本运算”

algorithm - 大欧米茄分析

c# - 会员推荐和评价的分配顺序