php - 如何像 Facebook 那样从网页中提取图像?

标签 php javascript ajax web-crawler

如果我在墙上插入这样的链接:

http://blog.bonsai.tv/news/il-nuovo-vezzo-della-lega-nord-favorire-i-lombardi-alluniversita/

然后 Facebook 提取帖子中的图像,而不是网页中的第一张图像(例如,不是图像 Logo 或其他小图像)!!

Facebook 是如何做到这一点的?

最佳答案

嗯,如果没有有关他们使用的算法的更多信息,就不可能说。

但是,通过查看页面的源代码,您可以看到,虽然 Bossi 的图像不是页面中的第一个图像,但它是 div“page_content”和“post_content”中的第一个图像。也许 Facebook 知道博客系统(本例中为 Wordpress)使用的 HTML ID,并使用这些 ID 来查找实际上属于页面内容的第一张图像。

这实际上是一个好主意,本质上是“语义网”的实现......

关于php - 如何像 Facebook 那样从网页中提取图像?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3813411/

相关文章:

javascript - 如何使用 JavaScript 将数据插入 Yii 框架 2.0 CKEditor 扩展?

javascript - 正则表达式 - 查找可以包含字符但不以字符结尾的模式(javascript)?

ajax - 使用 Ajax 将 JSON 发送到 WCF 3.5

java - 在 JSP 中从 JavaScript/jQuery 调用后端 Java 方法

javascript - 动态调整文本大小以填充 div

php - 如何进行跨域ajax调用

javascript - 从 wordpress 站点中删除脚本

php - JavaScript 和 PHP : Problems with PushState

php - 如何仅检查文件名而不检查扩展名是否存在

javascript - 是否可以读取文本文件并检查它?