我将如何编写伪代码以使用朴素贝叶斯算法将句子分类为好或坏?
我假设第一步是获取实验数据,这样你就有了带有好/坏词的例句,并且你有这些句子的示例输出(分类为好或坏)。但是我怎样才能使用这些数据来生成算法本身呢?
最佳答案
我不确定您在这种情况下所说的“好”或“坏”是什么意思,但您可能会发现 this research paper on Bayesian spam filtering很有用,尤其是关于“域特定属性”的部分,它描述了如何选择各种功能来尝试过滤垃圾邮件。如果您试图通过“好”和“坏”句子找到这些句子的各种标准,那么本文可能是一个很好的线索。如果您通过“好”和“坏”句子来查找有关检测语法错误等的信息,那么这可能不是一个很好的查找位置。 :-)
关于algorithm - 如何在句子中使用朴素贝叶斯,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6886359/