nltk - 零碎训练 NaiveBayesClassifier (NLTK)

我有很多文本数据，我想进行分类。我逐 block 递增地获取这些数据(例如 500 个样本)。我想用这些 block 在 NLTK 中对 NaiveBayesClassifier 进行训练，但要进行零碎的训练。

我可以用一个 chuck 训练 NaiveBayesClassifier，然后用它训练下一个 block 等吗？

我在文档中找不到这个问题的答案。

最佳答案

您可能应该为 scikit-learn 使用 NLTK 包装器，并使用 scikit-learn 提供的朴素贝叶斯实现。这个支持进行部分拟合，这正是您想要的:一次只训练一部分数据。

关于nltk - 零碎训练 NaiveBayesClassifier (NLTK)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22429282/

相关文章：

python - 构建包含不同测量值的 PyMC3 模型