machine-learning - 如何对连续数据进行分类?

标签 machine-learning classification

我有两个因连续变量,我想使用它们的组合值来预测第三个二元变量的值。我如何对值进行离散化/分类?我不是在寻找聚类算法,我特别感兴趣的是获得“有意义的”离散类别,我随后可以在贝叶斯分类器中使用。 论文、书籍、在线类(class)的指针,非常感谢!

最佳答案

这是机器学习的本质,也是研究最多的问题之一。

最小二乘回归、逻辑回归、SVM、随机森林广泛用于此类问题,称为二元分类。

如果您的目标是对数据进行实用的分类,可以使用多个库,例如 python 中的 Scikits-learn 和 java 中的 weka。他们有很棒的文档。

但是,如果您想了解机器学习的本质,只需搜索(在此处或在 Google 上)机器学习资源即可。

关于machine-learning - 如何对连续数据进行分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10496566/

相关文章:

java - 在Java中实现多维度的Adaboost

python - 如何在 Wavenet 的 Keras 实现中准备输入以进行时间序列预测

python - 如何将这些数据加载到 LSTM 中?

machine-learning - 不变奖励如何帮助训练?

python - sklearn : enable all cores using GridSearchCV

tensorflow - 对于多类问题,如何在 tensorflow 中对一类的损失进行更多的惩罚?

java - NLP - 确定一段文本是否在谈论给定的主题?

statistics - 机器学习-分类算法

C#:有没有办法对枚举进行分类?

machine-learning - ML 分类中的 SMOTE