c# - 如何检查 RSS 提要中帖子的唯一性(非重复)

标签 c# sql-server rss feed

当从 rss 提要中检索和缓存/保存(在数据库中)一些帖子时,如何确定:

  1. 是同一篇文章(例如:当 Feed 中的一些拼写错误得到修复,或者如果标题更改、日期更改等...)
  2. 查找讨论同一主题的供稿(例如:来自不同来源的同一故事)

这些东西有什么最佳实践吗?

非常感谢

最佳答案

一些 RSS 提要有一个 guid 元素作为标识符。具有共享 guid 的帖子可能是重复的。一些 RSS 提要只是在其中填充 URL 以表明帖子的唯一性与其 url 相关联。请注意,如果 URL 匹配但 Guid 不匹配,这可能表明帖子不是重复的。如果提要不维护存档,则 url 可能不会更改。这种情况可能非常罕见。

关于c# - 如何检查 RSS 提要中帖子的唯一性(非重复),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3656107/

相关文章:

c# - .NET 6.0 中的 Null 行为

c# - 在多个文件中搜索多个字符串的 Grep 工具

sql - "tempdb.mdf"由于 SQL 查询增加到天文大小(即 800GB)

javascript - 从 Node.JS 中的两个网站请求 RSS 提要

php - 如何检测页面是否为 RSS 或 ATOM 提要

xml - 如何从 TeamCity 检索 XML 中的构建状态

c# - 从列表中删除相似的项目

c# - NPOI 是否支持 .xlsx 格式?

sql - 如何使用关键字选择最小值

SQL Azure 数据库的 SQL 代理替代方案