algorithm - 如何在句子中使用朴素贝叶斯

我将如何编写伪代码以使用朴素贝叶斯算法将句子分类为好或坏？

我假设第一步是获取实验数据，这样你就有了带有好/坏词的例句，并且你有这些句子的示例输出(分类为好或坏)。但是我怎样才能使用这些数据来生成算法本身呢？

最佳答案

我不确定您在这种情况下所说的“好”或“坏”是什么意思，但您可能会发现 this research paper on Bayesian spam filtering很有用，尤其是关于“域特定属性”的部分，它描述了如何选择各种功能来尝试过滤垃圾邮件。如果您试图通过“好”和“坏”句子找到这些句子的各种标准，那么本文可能是一个很好的线索。如果您通过“好”和“坏”句子来查找有关检测语法错误等的信息，那么这可能不是一个很好的查找位置。 :-)

关于algorithm - 如何在句子中使用朴素贝叶斯，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6886359/

上一篇：java - 域模型的版本控制

下一篇：java - 存储项目到项目关联的算法

相关文章：

r - 如何从 ZIP 或 ZINB 模型获取贝叶斯 p 值的新样本

python - 如何改变NLTK中朴素贝叶斯分类器的平滑方法？

r - 在 R 中编写自己的 kmeans 算法

java - 任何人都可以为我提供一个基于引用的链表的示例吗？

c++ - 查找具有偶数值的 vector 元素

algorithm - 计算机编程艺术中approximatelyEqual和essentiallyEqual的区别

algorithm - 修改插入排序算法为非递增

python - 联合正态先验分布的后验

algorithm - 按相似度进行人脸聚类

java - Java 中等效的 'nth_element' 函数是什么？