我有一个包含 10,000 个公司网站的列表,如果他们有一个(任何和所有 rss 版本),我正试图发现他们的博客提要。如果没有必要,我不想抓取它们,那么是否有任何工具或特定技巧可以找到他们的大部分提要(如果存在的话)?
我的第一个想法是寻找博客提要的标准位置,但这些网站中的大多数主要不是博客,而是公司网站。欢迎提出任何建议。
首选基于 PHP 的工具。
最佳答案
抓取它们是唯一明智的选择,您可能只需要访问它们的主页即可。我会利用 Feed::Find获取页面并检测提要 URI。
关于php - 如何以编程方式发现给定域上的博客提要?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6515744/