我必须决定为我的下一个项目使用哪个数据库服务器,但是像我所做的几乎所有项目一样使用 MySQL 的简单决定现在变得更难了,因为我希望有很多记录。
数据库会存储一个用户列表,一些其他不相关的表,最后一个,一些用户收集的数据。比方说,如果我有 6000 名用户回答关于彼此的测验。简单的数学表明,如果每个用户都完成关于每个人的测验(在我的项目中,99% 肯定会发生),我最终将得到 3599 万条记录(他们将排除自己,在这种特殊情况下运算为 6000*5999)。不幸的是,6000 可能是一个小数字,真正的数字在一天天增长。
选择什么? MySQL,也许如果一切顺利并且项目增长以在集群中扩展它? PostgreSQL,MSSQL?甲骨文?
我已经阅读了所有这些,每个都有其优点和缺点,但仍然不知道该选择什么。 MySQL 和 PostgreSQL 的优势当然是起步价为 0 美元,这对于通常的自筹资金创业公司来说已经相当不错了。
有什么意见,建议吗?如果您在开发过程中遇到过这种情况,我很乐意听取您的意见。
最佳答案
如今,免费不再是数据库之间的区别。 Oracle 和 SQL Server 都有免费版本,但限制是资源 - 4 GB 数据库、RAM 和单 CPU 使用率。数百万条记录不是问题 - 问题在于您使用的数据类型。
我看到 OP 评论说不喜欢 MS 软件 - 这是你的特权,但使用 Oracle 或 SQL Server 的免费版本确实可以从无缝过渡到相应数据库的高档版本中获益。
就个人而言,我的选择是 Oracle 或 SQL Server,因为恕我直言,真正的功能考虑因素,如分层查询支持、子查询分解/CTE、包(早在我开始关注函数/过程之前) 、全文搜索、xml 支持等。
关于database - 大数据存储和操作使用什么数据库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1603088/