我正在使用 PHP 抓取一个带有 HTML 的网站,该网站检索页面并删除某些元素以仅显示照片库。它适用于所有浏览器,但适用于任何版本的 IE(典型 ;))。我们可以通过重写 .css 文件来解决这个问题,但是我们不能将它实现到 php 的头部,因为它会被来自网站服务器的 .css 文件覆盖。我们将如何托管我们自己版本的 .css 文件,以便我们的网站将使用我们的版本显示?会用过滤器换掉一些东西吗?
干杯!
最佳答案
您确实意识到这可能不是真正的抓取问题?这听起来像是一个简单的页面显示问题。
担心抓取可能是转移注意力。在你抓取之后你有一些 HTML(可能还有一些 CSS)......这在 W3C 上有效吗?我知道这并不能保证,但它是一个指标(我知道 IE 并不总是正确显示有效页面,但有时当其他浏览器似乎正确显示无效的 HTML/CSS 时,这是一个“问题”)。
如果它是有效的,那么也许你应该回顾一下你的抓取。如果您已经删除了某些元素以仅显示照片库
,那么也许您还可以从 HTML header (或任何地方)中删除 CSS 并用您自己的 CSS 重新加载它?
关于php 抓取 HTML - 仅限 IE 的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3305629/