我正在使用 SVM 来预测公交车到其路线上的公交车站的到达时间。在进行了大量研究并阅读了一些论文之后,我仍然对如何建模我的系统有一个关键疑问。
我们已经决定使用哪些特征,并且正在收集执行回归所需的数据,但令我们困惑的是使用某些特征作为 SVM 的输入或构建单独的机器的含义或后果基于其中一些功能。
例如,在这个 paper 中作者构建了 4 个 SVM 来预测公交车到达时间:一个用于晴天高峰时间、雨天高峰时间、晴天非高峰时间,最后一个用于非高峰时间和雨天。
但是在following paper上在同一主题上,他们决定使用单个 SVM,以天气状况和高峰/非高峰时间作为输入,而不是像以前那样将其分解为 4 个 SVM。
何时选择这些方法之一?
最佳答案
最重要的问题:数据是什么样的? 第二个问题:您希望用什么模型来捕捉这个?
因此,如果您出于某种原因想要使用 SVM,请记住它们的基 native 制是线性的,并且只有在数据经过合适的内核转换后才能捕获非线性现象。
对于手头的特定问题,这意味着:
- 您是否有理由(情节、对问题性质的见解)相信您的问题是线性的(可分离的)?只需使用一个线性支持向量机即可。
- 您是否认为您的问题由多个线性子问题组成?对每个子问题使用线性支持向量机。
- 您的数据似乎是非线性分组的吗?尝试使用诸如 rbf 内核之类的 svm。
当然,您可以直接插入并尝试,但检查以上内容可能会增加对问题的理解。
关于machine-learning - 使用特征作为输入与使用它在 SVM 上构建多台机器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10181832/