我有一个项目,我正在对一个大型数据库进行数据挖掘。我目前将所有数据存储在文本文件中,我试图了解存储数据关系数据库的成本和 yield 。这些点看起来像这样:
CREATE TABLE data (
source1 CHAR(5),
source2 CHAR(5),
idx11 INT,
idx12 INT,
idx21 INT,
idx22 INT,
point1 FLOAT,
point2 FLOAT
);
在合理的表现下,我能得到多少这样的分数?我目前有大约 1.5 亿个数据点,而且我可能不会超过 3 亿个。假设我使用的盒子有 4 个双核 2ghz Xeon CPU 和 8GB 内存。
最佳答案
PostgreSQL应该能够充分容纳您的数据——每个表最多 32 TB,等等。如果我理解正确,您目前谈论的是 5 GB,最大 10 GB(大约 36 字节/行,最多 3 亿行),因此几乎任何数据库实际上都应该能够轻松满足您的需求。
关于sql - 开源数据库中行数的上限?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1140369/