我构建了一个模型,根据主题(特征)中的关键字将电子邮件分类为 10 个不同的 work_categories
(标签)。但是,此任务可能包括将电子邮件分类到多个标签中的可能性。
例如:主题为“服务证书并转移它们”的电子邮件应分为两个标签,即 Servicing Worktype
(标签 1)和 Transfer Worktype
(标签 2)。在我当前的程序中,它仅分配给标签 1
。无论如何,我可以使用java中的spark ml将电子邮件分类到两个标签吗?
我一直在关注https://github.com/apache/spark/tree/master/examples/src/main/java/org/apache/spark/examples/ml寻求指导,但没有关于多标签分类的信息。
如果您有任何建议或文档可以帮助我,请告诉我。谢谢
最佳答案
LogisticRegressionWithLBFGS
和LogisticRegressionWithSGD
都支持多标签分类:
<强> LogisticRegressionWithLBFGS
Train a classification model for Multinomial/Binary Logistic Regression using Limited-memory BFGS. Standard feature scaling and L2 regularization are used by default.
或
<强> LogisticRegressionWithSGD
:
Train a classification model for Binary Logistic Regression using Stochastic Gradient Descent. By default L2 regularization is used, which can be changed via LogisticRegressionWithSGD.optimizer.
Using
LogisticRegressionWithLBFGS
is recommended over this.
关于java - 如何在Java中使用spark ml执行多标签分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57297896/