machine-learning - 使用特征作为输入与使用它在 SVM 上构建多台机器

标签 machine-learning svm

我正在使用 SVM 来预测公交车到其路线上的公交车站的到达时间。在进行了大量研究并阅读了一些论文之后,我仍然对如何建模我的系统有一个关键疑问。

我们已经决定使用哪些特征,并且正在收集执行回归所需的数据,但令我们困惑的是使用某些特征作为 SVM 的输入或构建单独的机器的含义或后果基于其中一些功能。

例如,在这个 paper 中作者构建了 4 个 SVM 来预测公交车到达时间:一个用于晴天高峰时间、雨天高峰时间、晴天非高峰时间,最后一个用于非高峰时间和雨天。

但是在following paper上在同一主题上,他们决定使用单个 SVM,以天气状况和高峰/非高峰时间作为输入,而不是像以前那样将其分解为 4 个 SVM。

何时选择这些方法之一?

最佳答案

最重要的问题:数据是什么样的? 第二个问题:您希望用什么模型来捕捉这个?

因此,如果您出于某种原因想要使用 SVM,请记住它们的基 native 制是线性的,并且只有在数据经过合适的内核转换后才能捕获非线性现象。

对于手头的特定问题,这意味着:

  1. 您是否有理由(情节、对问题性质的见解)相信您的问题是线性的(可分离的)?只需使用一个线性支持向量机即可。
  2. 您是否认为您的问题由多个线性子问题组成?对每个子问题使用线性支持向量机。
  3. 您的数据似乎是非线性分组的吗?尝试使用诸如 rbf 内核之类的 svm。

当然,您可以直接插入并尝试,但检查以上内容可能会增加对问题的理解。

关于machine-learning - 使用特征作为输入与使用它在 SVM 上构建多台机器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10181832/

相关文章:

machine-learning - 在 Keras 中保存迁移学习模型的正确方法

machine-learning - 使用 AutoML 识别准确性和丢弃的特征 (ml.net)

machine-learning - 梯度下降 : Do we iterate on ALL of the training set with each step in GD? 或者我们是否更改每个训练集的 GD?

javascript - 如何使用 Brain.js 查找模式

python - SVM 自定义 RBF 内核 IndexError

r - 绘制来自 svm 拟合的数据 - 超平面

machine-learning - 我应该如何使用 julia 训练 SVM?

python - Pandas 数据框的箱线图

python - 如何绘制 Python 3 维水平集?

python - NLTK SVM 分类器终止