我正在将来自众多 RSS 提要的文章收集到 MySQL 数据库中(只是实际提要中的标题和链接),并且我想确保在重新检查提要时不会两次输入同一篇文章。我预计表中最多可存储 200,000 个条目。
这是检查重复项的最佳方法:
- 使 URL 成为数据库中的唯一字段,
- 为每篇文章创建一个新的唯一标识符(例如 SHA1 网址和/或标题),
- 还有别的事吗?
编辑:感谢大家确认#1。
最佳答案
UNIQUE
键就是为此而设计的。
如果您想批量插入但可能有重复错误,请使用INSERT IGNORE
关于php - 识别存储在 MySQL 中的重复标题和/或 URL(RSS 文章),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12787825/