如何轻松提取仅嵌入 html 页面(如 img、pdf、flv、doc、rtf、wmc 等)而非 css 和 css 背景图像、javascript 的网页内容。
我正在将旧站点的内容迁移到新站点。重新上传所有图片、链接的 pdf、flv 等。
最佳答案
如果您使用过 XHTML,则可以使用普通的 XML 解析器。
关于css - 如何轻松提取嵌入在 <body> 内的 html 页面中的网页内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1802871/