svm - 如何使用 SVM 和 KNN 对文本文档进行分类

标签 svm knn document-classification text-classification

几乎所有的例子都是基于数字的。在文本文档中,我有文字而不是数字。

那么你能告诉我如何使用这些算法进行文本文档分类的简单示例吗?

我不需要代码示例,只需要逻辑

伪代码将有很大帮助

最佳答案

常用的方法是使用词袋模型 (http://en.wikipedia.org/wiki/Bag_of_words_model),其中分类器将学习文本中单词的存在,这很简单,但效果却出奇地好。

另外,这里有一个类似的问题:Prepare data for text classification using Scikit Learn SVM

关于svm - 如何使用 SVM 和 KNN 对文本文档进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16694088/

相关文章:

用于测试非线性 SVM 的数据集

Python OpenCV 3.1 : KNN not working with the example in docs

python - 残差图诊断以及如何改进回归模型

python - 抑制 libsvm 中的输出(python)

machine-learning - 新闻文章多类分类算法

java - Mahout 朴素贝叶斯 CSV 分类

python - 在训练 SVM 对图像进行分类时设置具有序列错误的数组元素

matlab - 为什么在 matlab 中使用带有 libsvm 的预计算内核

python - Scikit-learn SVM : Reshaping X leads to incompatible shapes

python - 如何确定 pycaret 中 knn 中邻居的数量