apache - 使用 Apache Mahout 对数据进行分类

标签 apache machine-learning hadoop mahout

我正在尝试解决一个简单的分类问题。

问题:
我有一组文本,我必须根据内容对它们进行分类。

使用 Mahout 的解决方案:
我知道我必须将输入转换为序列文件才能生成模型。是的,我能够做到这一点。现在,如何对测试数据进行分类? 20News 示例仅测试正确性。但是,我想做实际的分类。
我不确定是否需要编写代码或使用一些现有的类来对测试集进行分类。?

最佳答案

我讨厌插入自己的工作,但我们将整个部分放入 Mahout in Action 中关于分类的内容。理论、代码示例、案例研究实践,甚至整个服务器场实现。

您可以在 http://www.manning.com/owen/ 获取预发布版本

关于apache - 使用 Apache Mahout 对数据进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4137622/

相关文章:

php - 是否可以使用在 URL 中传递的值来查询数据库,并使用 mod_rewrite 将查询结果写入 URL?

tensorflow - 在离线推理(机器学习)的情况下,批处理配额是多少?

hadoop - 是否可以从SpringDM应用程序连接到HBase?缺少com.sun.security.auth的约束!

apache - 无法使 suexec 与 mod_fastcgi 一起工作

regex - 使用 .htaccess 重定向站点但排除两个以上的文件夹

python - 可能未见数据的标签编码

python - 如何将随机森林中选定的特征转换为新列表

scala - Spark中是否有类似twitter.scalding.addTrap的API处理异常

hadoop - 如何找到 oozie (hadoop) 作业运行的 hadoop 应用程序

apache - MockMVC 不能在 springboot 中使用 camel