machine-learning - 监督学习分类

标签 machine-learning regression nearest-neighbor supervised-learning unsupervised-learning

我知道 k-NN 是一种分类方案，对于要分类的每个点，采用 k 个最近邻，然后使用一定距离，并使用多数投票来对该点进行分类。

是否有类似的回归算法，其中只有一个类，即 A 类。您有一个包含 A 类特征空间中一些(不是全部)点的数据集。计算特征空间中新点的概率属于A类，你看看A类那个点距离k以内的密度？

最佳答案

我想你要的是probability density estimation 。您想要使用对 A 类中的点的观察来凭经验构建概率密度函数，然后使用该 PDF 来预测新点属于 A 类的概率。

实现此目的的方法有很多，最简单的可能是将数据建模为高斯分布或 mixture of Gaussians 。对于单个高斯模型，您只需计算数据集的均值和方差即可参数化高斯模型。这假设高斯模型非常适合您的数据集，如果不适合，则有 more sophisticated methods例如制作直方图或使用不同的分布。

但是，如果您只想对某个点是否属于某个类进行分类，那么估计密度可能就有点矫枉过正了。您可以使用众多分类算法中的任何一种(随机森林、SVM、逻辑回归、神经网络等)，这些算法不会告诉您有关数据的基本分布的任何信息，但只会为您提供一个分类器。

关于machine-learning - 监督学习分类，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54111370/

上一篇：python - Keras RNN(GRU、LSTM)产生平稳期然后改进

下一篇：matlab - 吴恩达机器学习类(class)第二周怎么解决，matlab上交作业

相关文章：

c# - Microsoft ml.net 连接 2 列作为标签

python - 多变量梯度下降

python - 在回归输出中命名解释变量

r - 公式中不同阶数因子的lm系数

image - Keras 实时增强添加噪声和对比度

python - 如何在使用 ImageDataGenerator 时使用 to_categorical

python - 在图像回归任务中尝试预测均值和标准差时无法获得良好结果

machine-learning - KNeighborsClassifier的概率预测方法仅返回0和1

c++ - Kd-Tree 有缺陷的 K 最近邻

machine-learning - 当我们有 K 最近邻的稀疏数据集时如何计算距离