machine-learning - 随机森林,文本分类

标签 machine-learning random-forest sentiment-analysis text-classification ensemble-learning

如何使用单词作为特征来使用随机森林算法对文本进行情感分析?我使用单词作为特征,而随机森林使用数字,这就是我陷入困境的地方。

最佳答案

我认为你可以使用sckit-learn来帮助你解决这个问题。可以在sckit-learn教程网站here找教程。这将非常有用。

使用文本功能时,您可以使用 CountVectorizer 或 DictVectorizer。看一下特征提取,特别是第 4.1.3 节 here .

为了方便您了解更多,您可以找个例子here 。它将有助于对文本文档进行分类。

关于machine-learning - 随机森林,文本分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35395918/

相关文章:

python - 如何计算 RandomForestRegression 中的 MSE 标准?

python - 如何在 Python 的 scikit-learn 中访问树深度?

Python - 使用逐点互信息进行情感分析

python - 如何在 scikit 的 feature.selection 中使用 "metrics.mutual_info"

python - GridSearchCV & RandomizedSearchCV - 运行后是否重新拟合模型

machine-learning - scikit-learn 中的决策函数是否返回到超平面的真实距离?

r - 获取随机森林中各个树的重要性

python - 用于股市预测的情绪词典

java - 识别用户何时开车、步行、骑自行车

machine-learning - Keras LSTM 输入特征和错误的维度数据输入