machine-learning - 随机森林，文本分类

标签 machine-learning random-forest sentiment-analysis text-classification ensemble-learning

如何使用单词作为特征来使用随机森林算法对文本进行情感分析？我使用单词作为特征，而随机森林使用数字，这就是我陷入困境的地方。

最佳答案

我认为你可以使用sckit-learn来帮助你解决这个问题。可以在sckit-learn教程网站here找教程。这将非常有用。

使用文本功能时，您可以使用 CountVectorizer 或 DictVectorizer。看一下特征提取，特别是第 4.1.3 节 here .

为了方便您了解更多，您可以找个例子here 。它将有助于对文本文档进行分类。

关于machine-learning - 随机森林，文本分类，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35395918/

上一篇：machine-learning - 在哪里可以找到数据对来练习实现线性回归？

下一篇：r - 错误: could not find function "includePackage"

相关文章：

python - 如何计算 RandomForestRegression 中的 MSE 标准？

python - 如何在 Python 的 scikit-learn 中访问树深度？

Python - 使用逐点互信息进行情感分析

python - 如何在 scikit 的 feature.selection 中使用 "metrics.mutual_info"

python - GridSearchCV & RandomizedSearchCV - 运行后是否重新拟合模型

machine-learning - scikit-learn 中的决策函数是否返回到超平面的真实距离？

r - 获取随机森林中各个树的重要性

python - 用于股市预测的情绪词典

java - 识别用户何时开车、步行、骑自行车

machine-learning - Keras LSTM 输入特征和错误的维度数据输入

©2024 IT工具网联系我们