database - 大数据存储和操作使用什么数据库?

标签 database

我必须决定为我的下一个项目使用哪个数据库服务器,但是像我所做的几乎所有项目一样使用 MySQL 的简单决定现在变得更难了,因为我希望有很多记录。

数据库会存储一个用户列表,一些其他不相关的表,最后一个,一些用户收集的数据。比方说,如果我有 6000 名用户回答关于彼此的测验。简单的数学表明,如果每个用户都完成关于每个人的测验(在我的项目中,99% 肯定会发生),我最终将得到 3599 万条记录(他们将排除自己,在这种特殊情况下运算为 6000*5999)。不幸的是,6000 可能是一个小数字,真正的数字在一天天增长。

选择什么? MySQL,也许如果一切顺利并且项目增长以在集群中扩展它? PostgreSQL,MSSQL?甲骨文?

我已经阅读了所有这些,每个都有其优点和缺点,但仍然不知道该选择什么。 MySQL 和 PostgreSQL 的优势当然是起步价为 0 美元,这对于通常的自筹资金创业公司来说已经相当不错了。

有什么意见,建议吗?如果您在开发过程中遇到过这种情况,我很乐意听取您的意见。

最佳答案

如今,免费不再是数据库之间的区别。 Oracle 和 SQL Server 都有免费版本,但限制是资源 - 4 GB 数据库、RAM 和单 CPU 使用率。数百万条记录不是问题 - 问题在于您使用的数据类型。

我看到 OP 评论说不喜欢 MS 软件 - 这是你的特权,但使用 Oracle 或 SQL Server 的免费版本确实可以从无缝过渡到相应数据库的高档版本中获益。

就个人而言,我的选择是 Oracle 或 SQL Server,因为恕我直言,真正的功能考虑因素,如分层查询支持、子查询分解/CTE、包(早在我开始关注函数/过程之前) 、全文搜索、xml 支持等。

关于database - 大数据存储和操作使用什么数据库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1603088/

相关文章:

mysql - SQlite 多表引用

database - 具有静态加密和审计功能的开源数据库

c# - 高性能 WebSocket 游戏服务器的单点登录?

python - 使用 SQLAlchemy 创建表,但将索引的创建推迟到数据加载完成

PHP Echo - 弹出 div 中的回显结果仅回显数据库中的第一个结果

php - 根据字段值传递数据库字段 ID 的运行 SQL

javascript - 如果值为 0,我可以隐藏文本框值吗?

c# - 如何从数据库中选择一周的日期?

mysql - 一个可能为 NULL 值的属性如何仍然引用 MySQL 中的另一个属性

php - 无法通过 PHP 将数据添加到我的 MySQL 数据库