css - 如何轻松提取嵌入在 <body> 内的 html 页面中的网页内容？

如何轻松提取仅嵌入 html 页面(如 img、pdf、flv、doc、rtf、wmc 等)而非 css 和 css 背景图像、javascript 的网页内容。

我正在将旧站点的内容迁移到新站点。重新上传所有图片、链接的 pdf、flv 等。

最佳答案

如果您使用过 XHTML，则可以使用普通的 XML 解析器。

关于css - 如何轻松提取嵌入在 <body> 内的 html 页面中的网页内容？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1802871/

相关文章：

javascript - 您可以停止 HTML5 视频在滚动时暂停/停止吗？