我尝试在 stackoverflow 上进行搜索以及大量谷歌搜索,但找不到我的问题的答案(我想我正在搜索错误的关键字/术语)。
我们正在构建推荐引擎,虽然我们最初将所有用户事件记录在自定义日志中(我们使用 ruby/rails),但我们需要对该文件进行 EOD 扫描并根据用户进行安排.我们还有一些来自其他地方的其他用户数据(他的 fb 事件、twitter 时间线等),因此通过 EOD,我们希望将特定用户的所有数据保存在某个地方,然后在所有的地方运行我们的分析器代码生成推荐的用户数据。
问题是我们正在生成大量数据,虽然目前我们正在使用 mysql 表来存储所有这些数据,但我们不确定要持续多久才能继续这样做,因为我们的用户群增长(我们仍在内部测试大约 10 个活跃的用户)。此外,作为热心的开发人员,我们希望尝试一些能够满足我们需求的新事物。
这方面的任何指示都会非常有帮助。
最佳答案
查看 Amazon Elastic Map Reduce .它就是为这种类型的东西而构建的。
关于mysql - 存储全站用户事件的有效方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3620803/