我最近一直在从事象夫工作。当前版本支持通过其数据模型从文件、MySQL 等输入。就我而言,原始数据驻留在客户端位置的 Postgres DB 中。原始数据在输入到 Mahout DataModel 之前需要进行大量的预处理。目前,我将精炼后的数据存储为一个简单的 *.csv
文件,并使用内置的 FileDataModel 将其加载到 Mahout。
是否可以使用内存数据库来实际存储精炼数据并使用其现有的 MySQLJDBCDataModel/JDBCDataModel 将其加载到 Mahout? 。如果是这样,什么样的内存数据库可以达到此目的
最佳答案
sqllite3 通常是内存数据库中的首选,并且有充分的理由它是最久经考验的数据库之一,并且几乎随处可见。您正在使用的浏览器可能正在使用它。它有一个相当简单的内存选项。即使基于磁盘,它也很快。
大多数拥有足够 RAM 的数据库都会有效地将大部分数据加载到 RAM 中。我很长一段时间都使用 PostgreSQL 作为搜索引擎的后端,大多数访问都是对 RAM 的,在读取时几乎没有任何内容会写入磁盘。如果您已经在 PostgreSQL 中拥有数据库,那么将其保留在其中可能会更简单。
关于mysql - 用于 mahout 推荐的内存数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36441891/