我正在创建一个应用程序,每周存储新信息,由大约数百万个唯一 URL 的 10 X 12 位整数组成。我需要提取给定 URL 的特定周或特定周范围的信息。我将使用 MySQL 作为数据库。
提示:为简化起见,按域对 URL 进行分组将减少查询时要处理的数据量。
我需要有关构建数据库以进行快速查询的建议,该数据库需要最佳的处理能力和磁盘空间。
最佳答案
由于没有其他人尝试过,这是我的建议。
首先,请忽略“需要最佳处理能力和磁盘空间的快速查询”。一开始就寻找这一点不会给你带来任何好处。设计并创建一个合理的数据库来满足您的功能需求。输入随机数据,直到获得大约您期望的数据量。针对它运行查询并计时。
如果您的数据库已正确标准化,则其占用的磁盘空间也将大致最小化。查询可能很慢:使用执行计划来查看它们慢的原因,并添加索引来提高它们的性能。一旦获得可接受的性能,就可以了。
主要观点是一句标准说法:在知道存在问题并对其进行测量之前不要进行优化。
关于php - 设置和配置 MySQL 数据库以存储有关十亿个唯一 URL 的信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24270710/