我是 Mahout 的新手。我需要将文本文件转换为向量以供后期分类。
任何人都可以阐明以下这些问题吗?
- 如何在 mahout 中将文本文件转换为矢量? 文件格式如“用户名|关于项目的评论|评分”
- 数据将是几个 TB。那么我可以使用哪种算法来使用我想创建的向量进行分类?
谢谢, 阿伦
最佳答案
关于apache - Apache Mahout 中的矢量化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11932668/