python - Scikit : How to choose alpha of multinomailNB

标签 python machine-learning scikit-learn

我使用 Scikit 编写了一个垃圾邮件过滤器。为此,我使用 MultinomialNB with alpha = 0.1 。 任何人都可以通俗地解释一下什么是 alpha(平滑因子)以及如何选择它的值?

谢谢

最佳答案

查看维基百科页面 http://en.wikipedia.org/wiki/Additive_smoothing .

基本上,您希望减少稀有单词的影响:例如,如果您有一封垃圾邮件中包含“multinomialNB”一词,并且没有包含该单词的非垃圾邮件,那么在不进行附加平滑的情况下,您的垃圾邮件过滤器会将带有此关键字的每封电子邮件分类为垃圾邮件。

关于python - Scikit : How to choose alpha of multinomailNB,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30498021/

相关文章:

python-3.x - Scikit 学习 : Incorporate Naive Bayes Model Predictions into Logistic Regression?

python - 值错误: Classification metrics can't handle a mix of unknown and binary targets

Python 字符串计数无法正常工作?

python - 谁能帮助正确使用 M2M 和模板?

python - 将时间字符串(小时 :Min:Sec. 毫秒)快速转换为 float

machine-learning - Word2Vec 数据设置

python - R 中的 scikit-learn 与网状结构

python - 如何为Docker容器分配更多内存?

python - 如何处理几何回归模型目标函数 exp 中的运行时溢出?

python - 如何快速验证 CNN 是否真正学习?