如何使用单词作为特征来使用随机森林算法对文本进行情感分析?我使用单词作为特征,而随机森林使用数字,这就是我陷入困境的地方。
最佳答案
我认为你可以使用sckit-learn来帮助你解决这个问题。可以在sckit-learn教程网站here找教程。这将非常有用。
使用文本功能时,您可以使用 CountVectorizer 或 DictVectorizer。看一下特征提取,特别是第 4.1.3 节 here .
为了方便您了解更多,您可以找个例子here 。它将有助于对文本文档进行分类。
关于machine-learning - 随机森林,文本分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35395918/