我们有大约 3 亿条记录的庞大数据,每 3-6 个月就会更新一次。我们需要(连续、实时)查询这些数据来获取一些信息。有什么选择 - RDBMS(mysql) ) ,或者其他一些选项,例如 Hadoop。哪个会更好?
最佳答案
300M 记录完全在常规关系数据库的范围内,如果正确使用索引,实时查询应该没有问题。
Hadoop 听起来有点大材小用,除非您确实需要高度分布式和冗余的数据,而且如果您遇到麻烦或需要优化,它也会让您更难找到支持。
关于database - 大数据——存储与查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/352895/