nlp - 如何在 Python 中对文本使用双正态分离

我正在寻找一种使用 Sklearn 实现双正态分离的方法。但我没有找到任何可用的解决方案。我读过Forman's article关于 BNS 特征缩放相对于 TF-IDF 的优势。

最佳答案

您可以使用为您在 Github 提到的文章制作的代码。您可以找到代码片段以及如何将 BNS 与 sklearn SVM 分类器一起使用的示例数量等。

您应该在转换数据之前拟合 BNS，尽管作者在示例中跳过了此阶段:

X_bns = bns.transform(X) #change to 
X_bns = bns.fit_transform(X)

代码是用 Python 2 编写的。请确保在 bns.py 中将“iteritems()”更改为“items()”。

关于nlp - 如何在 Python 中对文本使用双正态分离，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61609707/

相关文章：

text - 词干会损害文本分类的精度吗？