任何人都知道如何从任何给定的文章页面生成摘录(因此可以从多种类型的网站获取)?就像将 url 粘贴到帖子中时 facebook 所做的一样。谢谢。
最佳答案
您要执行的操作称为 web scraping .这样做的基本方法是捕获页面(您可以使用 file_get_contents
抓取 URL),然后以某种方式解析它以获得您想要的内容(即从 <body>
标签中提取内容)。
为了解析返回的 HTML,您应该使用 DOM 解析器。 PHP 有自己的 DOM classes你可以使用它。
关于PHP 从页面中提取文章摘录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3450764/