java - 使用 Mahout 时出现大文件问题

标签 java mahout mahout-recommender

当我尝试使用基于用户的推荐系统时启动大文件时遇到问题。我一步步按照“教程”启动示例,没有任何问题,但是当我放置文件(有 100k 行)时出现以下问题:

Exception in thread "main" java.util.NoSuchElementException
at com.google.common.base.AbstractIterator.next(AbstractIterator.java:75)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.processLine(FileDataModel.java:407)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.processFile(FileDataModel.java:363)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.buildModel(FileDataModel.java:259)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.reload(FileDataModel.java:231)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.<init>(FileDataModel.java:221)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.<init>(FileDataModel.java:169)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.<init>(FileDataModel.java:149)
at com.predictionmarketing.RecommenderApp.App.main(App.java:21)

有人可以帮助我吗?

最佳答案

您提供的文件可能有空行。
请检查最后一行是否为空。请尝试将鼠标指针放在文件末尾,如果鼠标进入空行,则删除该行。

关于java - 使用 Mahout 时出现大文件问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30388011/

相关文章:

hadoop - 没有来自 mahout 的输出文件

java - 从信息模式中获取oracle中的表名列表

java - java中使用的峰值内存和最大内存有什么区别?

java - 在 Netbeans 6.9.1 中验证 Java 类库

hadoop - Mahout - ParallelALSFactorizationJob 运行时间过长?

mahout - 根据项目属性查找相似项目

java - App Engine : How does memory work?(将 Mahout 与 App Engine 结合使用)

java - 在 Eclipse 中更改 Web 服务 java 代理方法返回类型

mahout - Apache 马胡 : can we combine User-Item and Item-Item?

hadoop - 如何在 apache pig 中将组转换为集合