database - 大数据——存储与查询

标签 database architecture hadoop mapreduce

我们有大约 3 亿条记录的庞大数据,每 3-6 个月就会更新一次。我们需要(连续、实时)查询这些数据来获取一些信息。有什么选择 - RDBMS(mysql) ) ,或者其他一些选项,例如 Hadoop。哪个会更好?

最佳答案

300M 记录完全在常规关系数据库的范围内,如果正确使用索引,实时查询应该没有问题。

Hadoop 听起来有点大材小用,除非您确实需要高度分布式和冗余的数据,而且如果您遇到麻烦或需要优化,它也会让您更难找到支持。

关于database - 大数据——存储与查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/352895/

相关文章:

javascript - Ajax 和 PHP : Is it possible to have Javascript, Ajax 函数和 PHP 帖子在单个提交中执行?

azure - Azure Web Apps 架构是什么样的?

design-patterns - 如何在 DDD 中正确设计模型的计算字段?

sql-server-2005 - 具有不同用户配置文件的 SQL Server 表

maven - 建立大象鸟 pig 时发生错误

MySQL:使用全部与使用某些 PK 列时的连接性能

php - 如何包含两个数据库连接?

database - wm_concat 的来源

java - ClassNotFoundException : org. apache.pdfbox.pdmodel.PDDocument

java - 如何在 java 中导入 distcp 包?