mysql - 用于 mahout 推荐的内存数据库

标签 mysql mahout in-memory-database mahout-recommender

我最近一直在从事象夫工作。当前版本支持通过其数据模型从文件、MySQL 等输入。就我而言,原始数据驻留在客户端位置的 Postgres DB 中。原始数据在输入到 Mahout DataModel 之前需要进行大量的预处理。目前,我将精炼后的数据存储为一个简单的 *.csv 文件,并使用内置的 FileDataModel 将其加载到 Mahout。

是否可以使用内存数据库来实际存储精炼数据并使用其现有的 MySQLJDBCDataModel/JDBCDataModel 将其加载到 Mahout? 。如果是这样,什么样的内存数据库可以达到此目的

最佳答案

sqllite3 通常是内存数据库中的首选,并且有充分的理由它是最久经考验的数据库之一,并且几乎随处可见。您正在使用的浏览器可能正在使用它。它有一个相当简单的内存选项。即使基于磁盘,它也很快。

大多数拥有足够 RAM 的数据库都会有效地将大部分数据加载到 RAM 中。我很长一段时间都使用 PostgreSQL 作为搜索引擎的后端,大多数访问都是对 RAM 的,在读取时几乎没有任何内容会写入磁盘。如果您已经在 PostgreSQL 中拥有数据库,那么将其保留在其中可能会更简单。

关于mysql - 用于 mahout 推荐的内存数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36441891/

相关文章:

linux - 在 Mahout kmeans 算法中使用 vectordump 命令获取空集群结果

hadoop - 正确的Mahout CVB最大迭代次数

machine-learning - 在 Mahout 中查找特征向量中的不同维度

Php mysqli 适用于 sql 但不适用于存储过程

php - Laravel 5.4 关系不起作用无法附加第二个参数

MySql - 排名,给定玩家的排名及周围

java - Java 内存数据库推荐

java - Hazelcast IMap 中的嵌套集合

mysql - SQL 多对多 - 非常简单