我使用 Scikit
编写了一个垃圾邮件过滤器。为此,我使用 MultinomialNB with alpha = 0.1
。
任何人都可以通俗地解释一下什么是 alpha(平滑因子)以及如何选择它的值?
谢谢
最佳答案
查看维基百科页面 http://en.wikipedia.org/wiki/Additive_smoothing .
基本上,您希望减少稀有单词的影响:例如,如果您有一封垃圾邮件中包含“multinomialNB”一词,并且没有包含该单词的非垃圾邮件,那么在不进行附加平滑的情况下,您的垃圾邮件过滤器会将带有此关键字的每封电子邮件分类为垃圾邮件。
关于python - Scikit : How to choose alpha of multinomailNB,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30498021/