machine-learning - 设计天气数据的分类问题

标签 machine-learning data-modeling classification regression

在普通的二类或多类分类问题中,我们可以使用任何著名的机器学习算法(例如朴素贝叶斯或 SVM)来训练和测试模型。 我的问题是,我收到了天气数据,其中标签变量的格式为“20% 雨,80% 干燥”或“30% 多云,70% 雨”等。 我应该如何解决这个问题?我需要以某种方式将问题转化为回归吗?在这种情况下,如果数据中有三个标签(雨、干燥、多云),将百分比信息转换为连续值的正确方法是什么? 感谢您的宝贵时间

最佳答案

假设表达式“20% 下雨,80% 干燥”和“30% 多云,70% 下雨”表示概率,则这些类别是互斥的,并且我们可以忽略可能的序数关系(例如“干燥 >多云 > 雨”)其中,诸如多分类逻辑回归之类的模型可能适合这些值,就好像它们被分组或复制一样。

我认为也可以采用其他临时程序,这可以最大限度地减少 Kullback-Leibler 分歧等问题。

关于machine-learning - 设计天气数据的分类问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5055112/

相关文章:

python - 如何使用新数据在 sklearn 中重新训练逻辑回归模型

algorithm - 找到属于具有最大值的区域的最大值如何近似该区域的边界?

machine-learning - Caffe 中的 "label"是什么?

python - sklearn [python]的roc曲线

database-design - 通用数据模型设计模式的任何资源?

mysql - 数据库设计 : relate to car's model or trim?

sql - 论坛线程投票/ View 的数据库架构,以及增加和显示 View 数量的策略

python - 如何将 Keras 中的多类别训练更改为二进制

python - NLTK 确定性衡量标准?

c# - 使用 accord.net 将数据分类为已知模式