algorithm - 如何在句子中使用朴素贝叶斯

标签 algorithm pseudocode bayesian

我将如何编写伪代码以使用朴素贝叶斯算法将句子分类为好或坏?

我假设第一步是获取实验数据,这样你就有了带有好/坏词的例句,并且你有这些句子的示例输出(分类为好或坏)。但是我怎样才能使用这些数据来生成算法本身呢?

最佳答案

我不确定您在这种情况下所说的“好”或“坏”是什么意思,但您可能会发现 this research paper on Bayesian spam filtering很有用,尤其是关于“域特定属性”的部分,它描述了如何选择各种功能来尝试过滤垃圾邮件。如果您试图通过“好”和“坏”句子找到这些句子的各种标准,那么本文可能是一个很好的线索。如果您通过“好”和“坏”句子来查找有关检测语法错误等的信息,那么这可能不是一个很好的查找位置。 :-)

关于algorithm - 如何在句子中使用朴素贝叶斯,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6886359/

相关文章:

r - 如何从 ZIP 或 ZINB 模型获取贝叶斯 p 值的新样本

python - 如何改变NLTK中朴素贝叶斯分类器的平滑方法?

r - 在 R 中编写自己的 kmeans 算法

java - 任何人都可以为我提供一个基于引用的链表的示例吗?

c++ - 查找具有偶数值的 vector 元素

algorithm - 计算机编程艺术中approximatelyEqual和essentiallyEqual的区别

algorithm - 修改插入排序算法为非递增

python - 联合正态先验分布的后验

algorithm - 按相似度进行人脸聚类

java - Java 中等效的 'nth_element' 函数是什么?