Dataset<Row> dataFrame = ... ;
StringIndexerModel labelIndexer = new StringIndexer()
.setInputCol("label")
.setOutputCol("indexedLabel")
.fit(dataFrame);
VectorIndexerModel featureIndexer = new VectorIndexer()
.setInputCol("s")
.setOutputCol("indexedFeatures")
.setMaxCategories(4)
.fit(dataFrame);
IndexToString labelConverter = new IndexToString()
.setInputCol("prediction")
.setOutputCol("predictedLabel")
.setLabels(labelIndexer.labels());
什么是 StringIndexer、VectorIndexer、IndexToString,它们之间有什么区别?我应该如何以及何时使用它们?
最佳答案
我只知道这两个:
StringIndexer 和 VectorIndexer
字符串索引器:
向量索引器:
看看这里的例子:https://mingchen0919.github.io/learning-apache-spark/StringIndexer-and-VectorIndexer.html
关于apache-spark - 什么是 StringIndexer 、 VectorIndexer 以及如何使用它们?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44195535/