如果我在墙上插入这样的链接:
http://blog.bonsai.tv/news/il-nuovo-vezzo-della-lega-nord-favorire-i-lombardi-alluniversita/
然后 Facebook 提取帖子中的图像,而不是网页中的第一张图像(例如,不是图像 Logo 或其他小图像)!!
Facebook 是如何做到这一点的?
最佳答案
嗯,如果没有有关他们使用的算法的更多信息,就不可能说。
但是,通过查看页面的源代码,您可以看到,虽然 Bossi 的图像不是页面中的第一个图像,但它是 div“page_content”和“post_content”中的第一个图像。也许 Facebook 知道博客系统(本例中为 Wordpress)使用的 HTML ID,并使用这些 ID 来查找实际上属于页面内容的第一张图像。
这实际上是一个好主意,本质上是“语义网”的实现......
关于php - 如何像 Facebook 那样从网页中提取图像?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3813411/