java - Mahout:一种格式如何加载和使用数据进行分类?

标签 java mahout

JavaDocs 和 mahout 快速启动页面很糟糕。我得到了 Mahout in action 书的副本。我已经阅读了大量的 Mahout in Action 书,它只关注 Reccomender 系统的格式化数据。

如何格式化保存分类数据的文件?

它是如何加载到 mahout 的数据模型中的,或者是否有不同的数据模型用于分类? (我看到了一些关于 vector 的东西)

您如何采用该数据模型并将其整合到您的分类系统中?

最佳答案

(刚刚看到你的另一个问题。)

我认为这些文档总体上不是很好。当像您这样的人添加文档时,它只会变得更好。但是,Mahout 不是产品,甚至也不是真正的库。它是面向开发人员的代码,几乎必须用作代码。

大多数分类(我对此知之甚少)使用 Vector,因此使用 VectorWritable 作为输入的 Hadoop 有线格式。

DataModel 与分类器无关,也没有对应物。这是推荐位的一部分。

关于java - Mahout:一种格式如何加载和使用数据进行分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10707185/

相关文章:

java - 为什么要编译?覆盖方法不是异常的子类

java - 具有异常处理的方法的构建器模式

java - 简单的java程序根据它们的值来处理canopy簇字符串

hadoop - 如何让 mahout 与 hadoop HDFS 交互

java - Apache Mahout K-means 集群实现

java - JSP 中的 fsockopen 等价物

java - Junits 的 Guice 和 Mockto

hadoop - mahout ssvd工作表现

Mahout 精确召回 Movielens 10M

Neo4j 和 Mahout 比较