我正在尝试解决一个简单的分类问题。
问题:
我有一组文本,我必须根据内容对它们进行分类。
使用 Mahout 的解决方案:
我知道我必须将输入转换为序列文件才能生成模型。是的,我能够做到这一点。现在,如何对测试数据进行分类? 20News 示例仅测试正确性。但是,我想做实际的分类。
我不确定是否需要编写代码或使用一些现有的类来对测试集进行分类。?
最佳答案
我讨厌插入自己的工作,但我们将整个部分放入 Mahout in Action 中关于分类的内容。理论、代码示例、案例研究实践,甚至整个服务器场实现。
您可以在 http://www.manning.com/owen/ 获取预发布版本
关于apache - 使用 Apache Mahout 对数据进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4137622/