java - 如何在Java中使用spark ml执行多标签分类

标签 java apache-spark machine-learning apache-spark-ml multilabel-classification

我构建了一个模型,根据主题(特征)中的关键字将电子邮件分类为 10 个不同的 work_categories(标签)。但是,此任务可能包括将电子邮件分类到多个标签中的可能性。

例如:主题为“服务证书并转移它们”的电子邮件应分为两个标签,即 Servicing Worktype(标签 1)和 Transfer Worktype (标签 2)。在我当前的程序中,它仅分配给标签 1 。无论如何,我可以使用java中的spark ml将电子邮件分类到两个标签吗?

我一直在关注https://github.com/apache/spark/tree/master/examples/src/main/java/org/apache/spark/examples/ml寻求指导,但没有关于多标签分类的信息。

如果您有任何建议或文档可以帮助我,请告诉我。谢谢

最佳答案

LogisticRegressionWithLBFGSLogisticRegressionWithSGD都支持多标签分类:

<强> LogisticRegressionWithLBFGS

Train a classification model for Multinomial/Binary Logistic Regression using Limited-memory BFGS. Standard feature scaling and L2 regularization are used by default.

<强> LogisticRegressionWithSGD :

Train a classification model for Binary Logistic Regression using Stochastic Gradient Descent. By default L2 regularization is used, which can be changed via LogisticRegressionWithSGD.optimizer.

Using LogisticRegressionWithLBFGS is recommended over this.

关于java - 如何在Java中使用spark ml执行多标签分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57297896/

相关文章:

java - Java 中的 Spark sql 选择和减少

apache-spark - 为什么Spark JavaRDD flatmap函数返回一个迭代器

tree - WEKA - RandomForest 如何知道树何时太深?

logging - 使用 Tensorflow Estimator 打印额外的训练指标

machine-learning - 如何利用标签概率进行文本分类?

Java Swing : Inner JFrame class closes main window on close

java - 持有多个继承其方法的实例的类

java - JTabbedPane 及其选项卡透明度不起作用

java - 无法运行Java Spark Hive示例

java - MPAndroid 图表中 setData() 返回 0