php - 识别存储在 MySQL 中的重复标题和/或 URL(RSS 文章)

标签 php mysql rss

我正在将来自众多 RSS 提要的文章收集到 MySQL 数据库中(只是实际提要中的标题和链接),并且我想确保在重新检查提要时不会两次输入同一篇文章。我预计表中最多可存储 200,000 个条目。

这是检查重复项的最佳方法:

  1. 使 URL 成为数据库中的唯一字段,
  2. 为每篇文章创建一个新的唯一标识符(例如 SHA1 网址和/或标题),
  3. 还有别的事吗?

编辑:感谢大家确认#1。

最佳答案

UNIQUE 键就是为此而设计的。

如果您想批量插入但可能有重复错误,请使用INSERT IGNORE

关于php - 识别存储在 MySQL 中的重复标题和/或 URL(RSS 文章),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12787825/

相关文章:

php - 无法访问 Drupal 的 MySQL 数据库

PHP 按姓名和姓氏或中间名搜索

xml - 在 Lua 中安全生成 XML

java - 来自 RSS 的图像 URL

php - 生成 PHP SimpleXML RSS 提要时出现 UTF8 错误

javascript - 在关闭当前页面的同时刷新旧页面并在 url 中添加一个 Action

php - PEAR 和 PEAR2 有什么区别?

php - 使用ajax和php更新mysql(使用jquery)

python - 将日期之间的数据从 MYSQL 提取到 pandas 中

PHP Laravel 框架数据库连接错误