r - 使用 R 进行机器学习多标签文本分类

标签 r machine-learning text-mining modeling text-classification

我正在用 R 构建一个机器学习文本分类模型。如果句子属于多个类别,我希望将其分类为多个标签。

例如:“手机屏幕分辨率很棒,电池生命周期也很棒” - 目前我可以将句子分类为电池或手机功能类别,但我希望将其分类为两者。

输出可以是这样的: enter image description here

如果有人可以帮助我提供获得上述结果的想法或方法,那就太好了。

最佳答案

我建议为每个标签训练一个二元分类器。

对于某些算法(例如逻辑回归),您所能做的就是独立训练每个二元分类器。

还有所谓的多标签算法 - 它们同时训练所有二元分类器,并从每个分类器的数据中提取相同的特征。一个例子是最后一层为 sigmoid 的神经网络。请参阅 http://scikit-learn.org/stable/modules/multiclass.html 中的“支持多标签”部分获取多标签算法列表。

当然,多标签算法不一定优于逻辑回归,您必须尝试看看哪种算法最适合您的问题。

关于r - 使用 R 进行机器学习多标签文本分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48006309/

相关文章:

r - 当列名是年份时减去列

r - 表中每个单元格的线性回归

machine-learning - 如何使用 MATLAB 神经网络工具箱中的自定义神经网络函数

java - 可以推荐哪种语言用于文本挖掘/解析?

text-mining - 关于 word2vec most_similar() 函数

python - 使用 Matplotlib 在高斯上绘制标准差图

machine-learning - 机器如何知道哪一步可以获得最大奖励?

machine-learning - 为什么不在训练数据集上优化超参数?

r - tm 包中的 DocumentTermMatrix 不返回所有单词

r - 识别时间序列中重复的数字序列